Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Не получили письмо с кодом активации?

 


Автор Тема: Статистика по выборам. Рекомендую всем посмотреть.  (Прочитано 1346 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ST

  • модератор
  • YaBB God
  • *****
  • Сообщений: 949

Оффлайн dezdimon

  • модератор
  • YaBB God
  • *****
  • Сообщений: 1568
Интересные картинки))
Надо перед выборами такие музрзилки публиковать про прошлые, где бы рассказывалось, как всё это враньё прекрасно можно проиллюстрировать и уговаривать людей в эту копилку свои пять копеек не кидать.

Кстати, кто-нибудь ходил на выборы за рубежом? Я был в посольстве в Гааге и там всё было мирно, празднично и дружелюбно, никаких таких ужасов, про которые весь контакт и фейсбук изошёлся. Хотя нет причин и им не верить.

Оффлайн DrX

  • модератор
  • YaBB God
  • *****
  • Сообщений: 815
  • I'm so happy
Пики в распределении по проценту проголосовавших объясняются наличием участков с малым количеством избирателей. Я такие пики наблюдаю в своих данных сплошь и рядом.

Я не поленился и скачал данные, по которым строились графики, из-за которых все так возбудились. Вот изначальное распределение:


Наиболее подозрительный пик наблюдается в районе 50%:


Проведем эксперимент. Вместо величины 100.*nvot/ntot (ntot - число действительных бюллетеней, nvot - число голосов за ЕдРо) построим распределение величины 100.*Binomial(ntot,0.5)/ntot, где Binomial - биномиальная случайная функция. Для эксперимента будем брать только участки, которые показали результаты между 45% и 55%. Что мы получим?



Вот как далеко зашли происки ЕдРа. Мало того, что они бюллетени подменили, они еще и генераторы случайных чисел научились подкручивать. Колдуны, не иначе.
« Последнее редактирование: Дек 08, 2011, 23:19 от DrX »

Оффлайн ST

  • модератор
  • YaBB God
  • *****
  • Сообщений: 949
Где то показывали статистику по голосованиям на зарубежных участках-  повсеместно едро было на 3-4 месте.  Но ссылку искать уже  лень.

Оффлайн ST

  • модератор
  • YaBB God
  • *****
  • Сообщений: 949

Оффлайн Сергей Ш.

  • Moderator
  • YaBB God
  • *****
  • Сообщений: 2211
    • Общество содействия развитию науки в России

Я не поленился и скачал данные, по которым строились графики, из-за которых все так возбудились.


Не знаю насчет всех, но меня лично в основном интересует вот этот график: http://trv-science.ru/2011/12/06/vybory-2011/  Вы могли бы прокомментировать?

100.*Binomial(ntot,0.5)/ntot

Откуда 0.5?

Для эксперимента будем брать только участки, которые показали результаты между 45% и 55%.

В чем смысл такого ограничения?

Оффлайн DrX

  • модератор
  • YaBB God
  • *****
  • Сообщений: 815
  • I'm so happy
0.5 и диапазон 45%-55% - это было для простейшей модели, просто показать, откуда берутся пики. Я с тех пор довольно сильно продвинулся в моделировании :) Вот картинки.

Реальные данные:


Модель:


Б общем, там есть два типа пиков. Пики на 40%, 50%, 60% - "естественные", результат квантизации. А все, что выше, модель не описывает, и происхождение их - ненаучное. Пример - результаты голосования в Северной Осетии:


Оффлайн DrX

  • модератор
  • YaBB God
  • *****
  • Сообщений: 815
  • I'm so happy
Не знаю насчет всех, но меня лично в основном интересует вот этот график: http://trv-science.ru/2011/12/06/vybory-2011/  Вы могли бы прокомментировать?
Я на это внимательно не смотрел, но как бы корреляция между явкой на выборы и процентом голосов за правящую партию ожидаема? Если на данном участке настроения либеральные и люди недовольны, часть из них выражает свое недовольство тем, что не ходит на выборы, а часть - тем, что голосует против. И наоборот, если правящая партия хочет добиться успеха на выборах, работа идет в двух направлениях - обеспечить высокую явку и обеспечить правильный выбор. Вброс и отъем для меня не очевиден.

P.S. вот американское исследование на эту тему (реалии, конечно, другие, но все равно полезно):
http://faculty.ucmerced.edu/thansford/Articles/Estimating%20the%20Electoral%20Effects%20of%20Voter%20Turnout.pdf
« Последнее редактирование: Дек 11, 2011, 14:07 от DrX »

Оффлайн ST

  • модератор
  • YaBB God
  • *****
  • Сообщений: 949
Хороший пример работы с электоратом был продемонстрирован как известно в психбольницах вот уже точо как в той песенке- наш дурдом голосует за Путина. И явка была 99%.

Оффлайн Сергей Ш.

  • Moderator
  • YaBB God
  • *****
  • Сообщений: 2211
    • Общество содействия развитию науки в России
0.5 и диапазон 45%-55% - это было для простейшей модели, просто показать, откуда берутся пики.

И все-таки, 0.5 - это вероятность голосования каждого избирателя за ЕдРо? Но ведь по участкам варьирует и число избирателей, и вероятности голосования за любую из партий, и эти вариации вряд ли сколь-нибудь существенно скоррелированы.


Я с тех пор довольно сильно продвинулся в моделировании :) Вот картинки.


Да, это вроде бы более реалистично, но меня Вы пока не убедили. Вариации, о которых я выше сказал, должны все полностью размазать. И почему пики именно на круглых цифрах??

корреляция между явкой на выборы и процентом голосов за правящую партию ожидаема? Если на данном участке настроения либеральные и люди недовольны, часть из них выражает свое недовольство тем, что не ходит на выборы, а часть - тем, что голосует против. И наоборот, если правящая партия хочет добиться успеха на выборах, работа идет в двух направлениях - обеспечить высокую явку и обеспечить правильный выбор. Вброс и отъем для меня не очевиден.

Непонятно, как такие факторы могут сделать корреляцию между явкой и голосами за единственно достойную строго линейной.

P.S. вот американское исследование на эту тему

Спасибо, но для меня это слишком многабукафф. Хотя мои инициалы и совпадают с автором, на которого я сослался, я все-таки совсем другой человек (хотя меня уже несколько раз принимали за него :) ) и мой интерес к выборной статистике, увы, куда более поверхностный.

« Последнее редактирование: Дек 11, 2011, 15:27 от Сергей Ш. »

Оффлайн DrX

  • модератор
  • YaBB God
  • *****
  • Сообщений: 815
  • I'm so happy
И все-таки, 0.5 - это вероятность голосования каждого избирателя за ЕдРо? Но ведь по участкам варьирует и число избирателей, и вероятности голосования за любую из партий, и эти вариации вряд ли сколь-нибудь существенно скоррелированы.
я же говорю, 0.5 было в простейшей модели. В модели, с которой получены последние картинки, строится, грубо говоря, величина 100.*Binomial(ntot,raw->Random())/ntot, где raw - это распределение по голосам. Поэтому и получается хорошее описание данных.

Число избирателей и вероятности голосования на самом деле скореллированы гораздо сильнее, чем Вы думаете (я это тоже пробовал моделировать), но к пикам на круглых числах это прямого отношения не имеет.

Цитировать
Да, это вроде бы более реалистично, но меня Вы пока не убедили. Вариации, о которых я выше сказал, должны все полностью размазать. И почему пики именно на круглых цифрах??

Вариации не размазывают пики, потому что Binomial() всегда возвращает целое число. Это принципиально.

Объясняю на пальцах, откуда пики. Допустим, на все участки пришли ровно четыре избирателя. Тогда, как бы они ни голосовали, возможны только 5 исходов: 0%, 25%, 50%, 75%, и 100%. Т.е. имеем 5 пиков.

Теперь предположим, что на участки пришло случайное число избирателей от 1 до 4. Тогда возможны такие результаты:

число избирателейрезультат выборов
10%, 100%
20%, 50%, 100%
30%, 33%, 66%, 100%
40%, 25%, 50%, 75%, 100%

Как видите, получается интерференция между случаями с ntot=2 и ntot=4 - если построить случайное распределение, то пик около 50% будет гораздно более заметен, поскольку в него вносят вклад все участки с четным числом избирателей (а остальные пики размазываются). То же верно и для всех результатов, выражаемых отношением небольших целых чисел (33% = 1/3, 25% = 1/4, 20% = 1/5, 40% = 2/5, и т.д.). От этих пиков легко избавиться, если поставить нижний предел на число избирателей (например, ntot>1000).

Цитировать
P.S. вот американское исследование на эту тему
Спасибо, но для меня это слишком многабукафф

:) Он там, в частности, обсуждает то, что называется partisan bias - аналогию которого мы, собственно, и наблюдаем.
« Последнее редактирование: Дек 11, 2011, 16:25 от DrX »

Оффлайн ST

  • модератор
  • YaBB God
  • *****
  • Сообщений: 949
Понятно- значит чем больше явка тем меньше было на участке избирателей и тем вероятнее оказались целые числа для единой России. Там где явка была 100% очевидно что на участке был всего один человек. Еще забыли варианты где на всем участке голосует только один избиратель а остальные по совету немцова бюллютени портят. Тогда все их голоса достаются едру так как один человек никогда не проголосует за яблоко к примеру. Что интересно так это то что на участках с высокой явкой голосовали только за одну партию. А похожие аномалии для других партий не проявились.
Ну хоть бы на одном участке , ну хоть в психбольнице какой нибудь, все бы проголосовали к примеру за коммунистов. Так нет же...

Оффлайн DrX

  • модератор
  • YaBB God
  • *****
  • Сообщений: 815
  • I'm so happy
Еще забыли варианты где на всем участке голосует только один избиратель а остальные по совету немцова бюллютени портят.
я делил на число действительных бюллетеней

Оффлайн Сергей Ш.

  • Moderator
  • YaBB God
  • *****
  • Сообщений: 2211
    • Общество содействия развитию науки в России
1-4 голосующих - это какая-та суперэкзотика, а уже при 10 пришедших пик на 50% будет намного ниже. Надо бы обсуждать конкретные значения, но искать их некогда  :-[

Вообще мелкие пички - это не более чем мелкие пички, так что я сюда вставлю график из http://trv-science.ru/2011/12/06/vybory-2011/ - чтобы зрительное впечатление от "статистики выборов" не был слишком однобоким ;)  Каждая точка - данные по одной "территориальной избирательной комиссии" (ТИК).

« Последнее редактирование: Дек 12, 2011, 01:07 от Сергей Ш. »

Оффлайн DrX

  • модератор
  • YaBB God
  • *****
  • Сообщений: 815
  • I'm so happy
Я понимаю, что Вам этот график очень нравится. Мне он тоже нравится. У меня только два замечания. Первое: если я понимаю правильно, по оси у отложено отношение проголосовавших к полному числу избирателей, а не к числу явившихся, так? Т.е. в график изначально заложена линейная корреляция между х и у. И второе: чисто математически из наличия корреляции нельзя сделать вывод, что именно имеет место - особенности электората или фальсификация результатов.