?

Log in

No account? Create an account
Поделиться Next Entry
Фальсификации на московских выборах - 2009
dmitry_platonov
Все уже давно обсудили эту животрепещущую тему, а я только подтягиваюсь.
Тема заинтересовала меня не только с политической, но и с математической точки зрения. Наиболее очевидное свидетельство фальсификации (а именно, вброса голосов за Единую Россию) - статиситческая зависимость числа голосов за ЕР от явки. Например, анализ и еще анализ.
Факт вброса подтверждается таже заявлением и неднократным взятием с поличным людей, которые не имеют московской регистрации и которым выдавались бюллетени.
Однако я решил проверить выкладки сам, причем мне было интересно, как выглядит ситуация на самом нижнем уровне, доступном для анализа - на уровне УИК-ов. Будучи программистом, я посчитал, что выделять-вставлять мышкой мне западло (да и вероятность ошибки достаточно велика), поэтому я набросал несколько скриптов на perl-е, чтобы вытащить данные со страниц сайта мосизбиркома. Так родился набор данных, который я использовал для последующего анализа. Я уверен, что импорт произошел правильно, так как контрольные параметры по каждому УИК-у сходятся. Суммы по всем графам также сходятся с опубликоваными на сайте мосизбиркома. Описание полей файла находится внизу поста. Публикую файл я для того, чтобы способствовать анализу данных и в качестве ответа воинствующим едрофилам, если таковые будут.
Для начала, я проверил неднократно высказаную гипотезу о зависимости процента голосов от явки для ЕР и независимость для других партий. При построении графика по данным со всех УИК-ов получается следующая картина:


по оси x - явка ($9 + $10)/$4 (здесь и далее $N обозначает столбец N из файла), по оси y - процент голосов, поданый за данную партию ОТ КОЛИЧЕСТВА ИЗБИРАТЕЛЕЙ ПО СПИСКУ (а не от голосовавших) $K/$4 для K=21,22 (ЕР и КПРФ соответственно). Логичный результат - это распределение вокруг двух прямых, проходящих через 0. То, что мы видим - две прямые y=0.95*x - 0.1 и y=0.048 (прямые проведены на глаз из-за болшого количества аномальных участков). Это вообще не имеет смысла. Результат абсурден. ЕР-у голосов вкинули столько, что не видно реальной зависимости (вброс в райное 50%) Участки в правой части графика с явкой под 100% - в основном спецучастки (номера >= 3100).

Для желающих увидеть графк с "нормальными"(т.е. не к числу избирателей ,а к числу действительных бюллетеней) процентами - пожалуйста. Те же данные, но по y - $K/$12. Виден резкий рост процента ЕР с явкой и падение у КПРФ.


Кстати, по этому графику уже видна линия "явка 20%". Видимо, была команда обеспечить явку не менее 20%. Посмотрим на гистограмму.



По х - явка в процентах, по y - количество УИК-ов, в которых данная явка наблюдалась

А вот гистограмма процентов ЕР. Что характерно, локальные максимумы находятся на 50, 60, 70, 75 и 80 процентах. Любят люди круглые цифры, что поделать!


Продолжение следует...

Формат файла:
1 Номер ОИК
2 Номер ТИК
3 Номер УИК
далее информация по единому избирательному округу, порядок как на сайте мосизбиркома
4 Число избирателей внесенных в список
5 Число бюллетеней, полученных УИК
6 Число бюллетеней, выданных в помещении УИК
7 Число бюллетеней, выданных вне помещения
8 Число погашенных бюллетеней
9 Число бюллетеней в переносных ящиках
10 Число бюллетеней в стационарных ящиках
11 Число недействительных бюллетеней
12 Число действительных бюллетеней
13 Число открепительных удостоверений, полученных УИК
14 Число открепительных удостоверений, выданных УИК
15 Число избирателей, проголосовавших по открепительным удостоверениям на УИК
16 Число погашенных неиспользованных открепительных удостоверений
17 Число утраченных бюллетеней
18 Число бюллетеней, не учтенных при получении
19 голосов за "Московское городское отделение ЛДПР"
20 голосов за "Московское городское региональное отделение партии "ПАТРИОТЫ РОССИИ"
21 голосов за "Московское городское региональное отделение Партии "ЕДИНАЯ РОССИЯ"
22 голосов за "Московское городское отделение Коммунистической партии Российской Федерации"
23 голосов за "Региональное отделение Партии СПРАВЕДЛИВАЯ РОССИЯ в Москве"
24 голосов за "Региональное отделение Партии "ЯБЛОКО" в Москве"
далее информация по одномандатному (многомандатоному)  округу, порядок как на
сайте мосизбиркома
25-39 аналогичны 4-18
40-... голосов за соответствующего канидата

  • 1

Уточнение

Дмитрий, скажите, в каких интервалах вы суммировали данные для распределения числа комиссий от явки? У меня получились характерные пики на 30 и 40%, а у вас нет. Может, для точки Х% вы брали интервал от Х до Х+1%? Это не совсем правильно. Лучше брать границы интервала от Х-0,5 до Х+0,5%.

Если не жалко, обнародуйте свой чудо-скрипт для извлечения данных (и как им воспользоваться), я убил часа 4 на перенос данных: files.mail.ru/QKJGGH . Хотелось бы поанализировать и другие выборы, но терпения, боюсь, больше не хватит

Re: Уточнение

Я строил именно от X до X+1%. Считаю это правильным по психологическим причинам - 19.8% это, скорее 19%, чем 20%. Скрипт (скорее, набор скриптов) выложу чуть позднее. Где-то в LJ видел альтернативные скрипты на perl-е и lisp-e.

Психология и точность

Дело, конечно, ваше, на каких интервалах строить гистограмму, но, если бы вы брали бы интервал в окрестности точки процентов явки, то не упустили бы выброс на 30% явки, логично объясняемый приписками. А то получился провал в гистограмме (и неявный пик на 40%), по которым можно сделать вывод, что приписок не было, что не совсем так. См. http://andirect.livejournal.com/3215.html

  • 1