Previous Entry Share Next Entry
Кто же победил на выборах в Мосгордуму?
andirect


Продолжая анализ, начатый в предыдущих постах, попробуем улучшить статистические характеристики распределения.
 Сформулируем критерии правильной статистики голосования: 
1. закон распределения явки избирателей должен быть близок к нормальному (хотя для этого требуется, чтобы группы избирателей были достаточно однородными, считаем, что для Москвы это условие в целом выполняется, исключим из рассмотрения участки с аномально высокой явкой);
2. процент проголосовавших за определённую партию должен монотонно возрастать при увеличении явки, наклон получающейся кривой с ростом явки должен приближаться к проценту сторонников в генеральной совокупности. Возможно выполаживание этой кривой с ростом явки для некоторых партий в случае повышенной активности этой группы избирателей (голосует большинство из этой группы, независимо от явки сторонников других партий).

Рассмотрим картинку распределения итогов голосования в зависимости от явки, дополненную кривой плотности нормального распределения с характеристиками, соответствующими явке:


Можно заметить, что второе условие для оппозиции (характеристики почти идентичны по всем партиям) выполняется, кривая монотонно растёт и выполаживается, что может говорить об активности её сторонников. Для ЕР условие почти выполняется, но наклон кривой не уменьшается с ростом явки, а растёт, что не поддаётся интерпретации и говорит о вбросе бюллетеней, увеличивающемся с ростом явки, или, что рост явки во многом и вызван этим вбросом. Первое условие для кривой явки не выполняется, распределение сильно отличается от нормального, на кривой явки сильные неравномерности, которые нельзя объяснить статистической погрешностью, так как выборки в каждом процентном интервале достаточно большие, порядка 60 тыс избирателей и сотни участков в среднем диапазоне явки.

Попробуем улучшить статистику, оценив и исключив вероятный вброс. Первой гипотезой, высказанной в предыдущем посте, является следующая: вброс, ВБ, равен разнице между показанным (на соответствующем участке) процентом явки, %УИК и неким фиксированным (честным) процентом, ЧП, умноженным на масштабный коэффициент, К, в диапазоне 0 .. 1:

ВБ = (%УИК - ЧП) * К, в % от числа выданных бюллетеней

Какими выбрать ЧП и К? По графикам видно что до 23% кривые ЕР и оппозиции имеют сходный характер, так что разумно сверху ограничиться этой величиной. К графически можно интерпретировать как наклон кривой роста % бюллетеней, полученных за партию к росту явки, эта величина меняется от 0,6 до 0,9.

Сначала оценим предположение о мягком вбросе, ЧП=22%, К=0,65. Полученные кривые имеют вид:



Видно, что сделанные предположения о вбросе недостаточны, рост числа бюллетеней за ЕР опережает рост за оппозицию. Уже при этом вбросе в Думу проходят все, кроме Яблока и Патриотов. Кривая явки удовлетворительно соответствует нормальному распределению.

Средний вброс: ЧП=12%, К=0,75:



Распределение явки приобрело несимметричный характер, проценты голосов растут логично, за исключением области явки 14-18%. Все, кроме Патриотов, проходят в Думу. КПРФ почти сравнялась с ЕР.

Случай сильного вброса ЧП 9%, К=0,76:


Кривая явки хорошо соответствует нормальной, за исключением начального участка, КПРФ побеждает ЕР.

Выводы:
1. Без дополнительной информации о распределении явки, например с предыдущих выборов, трудно сделать обоснованное заключение о величине вброса за ЕР. Возможны различные предположения, удовлетворительно согласующиеся с имеющимися данными. Предположительный вброс 15-20%, явка 15-20%, EP 22-35%, КПРФ 25-30%.
2. Возможно улучшить моделирование вброса, применив нелинейную формулу, например:
ВБ = (%УИК - ЧП)**2 * К, так как выяснилось, что вброс при больших процентах показанной явки увеличивается.
 


  • 1
Выполаживание голосов за "прочие" партии при высоких явках естественным образом возникает в модели случайного вброса - в зависимости от количества вброшенных голосов участки размазываются по оси явки.
Вопрос об активности оппозиционных избирателей сложный - при объяснении распределений по явке защитники выборов говорят, что оппозиционные избиратели активны и пришли на выборы все, и одновременно аналитики ЕР утверждают, что "оппозиционные избиратели плохо мобилизовали своих избирателей".

Не исключены и альтернативные подходы

Хотя вариант со вбросом просится в качестве единственной гипотезы, ради объективности надо рассмотреть и альтернативные варианты, пусть они и кажутся надуманными, иначе мы рискуем скатиться к подгону фактов под рождающиеся мысли.

Дайте совет (а то математику изучал очень давно, да и институт был не математического профиля):
как определить мат. ожидание процента вброса для определённого значения явки? Это будет интеграл от плотности (предполагаемого) распределения вброса до этого значения явки?
Если удастся формализовать определение этого процента и распределение вброса имеет близкий к нормальному характер, то можно будет, оперируя средним и стандартным отклонением этого распределения, весьма точно определить и скомпенсировать вброс, не прибегая к умозрительным формулам.

Re: Не исключены и альтернативные подходы

1. Возможно, я чрезмерно категоричен, просто я занимаюсь этим давно и уже остановился на одной точке зрения - почитайте журнал с верхнего поста.
2. Если я правильно понимаю, ответ на ваш вопрос - это то, что у меня называлось "аномальной частью" голосов за кандидатуру власти. Можно действительно попробовать вычесть ее не только из голосов, но и из явки тоже и посмотреть на результирующее распределение.
Меня останавливает то, что вброс может быть разным и участки могут оказываться на явке X из разных мест, поэтому вернуть их назад однозначно нельзя. Но попробуйте.
Кстати, обратите внимание на пост от 27-го октября: распределение голосов за "прочие" кандидатуры практически гауссово, за исключением небольшого количества участков.

Re: Не исключены и альтернативные подходы

Да, я с большим интересом прочитал ваш материал от 27 числа. Впечатляет простота и наглядность метода. Вот бы ещё ухитриться на этой основе сделать выводы о вбросе в ракурсе значений явки, методу не было бы цены, левая сторона распределения за ЕР позволяет делать более обоснованные предположения о параметрах истинного распределения числа сторонников этой политической группы.

К сожалению, не могу делать комментарии к вашим постам, к отзывам - могу, а к постам - нет, не знаю почему.

Re: Не исключены и альтернативные подходы

Очень странно, для френдов ничего не закрывал.

1. закон распределения явки избирателей должен быть близок к нормальному (хотя для этого требуется, чтобы группы избирателей были достаточно однородными, считаем, что для Москвы это условие в целом выполняется, исключим из рассмотрения участки с аномально высокой явкой); -

Это ниоткуда не следует, но легко проверяется по существующим протоколам.
Вы проверяли?
Покажите картинку.

Вот и приплыли к началу.

По существующим протоколам победила "Единая Россия" с 66,25% голосов. Если считать эту цифру верной, то голову вообще можно не напрягать.

Картинку смотрите в этом посте.
Это верхняя картинка.

Re: Вот и приплыли к началу.

(Anonymous)
Положим, если считать эту цифру изначально неверной, то голову тоже
можно не напрягать :-)
Ее верность или неверность надо доказывать.
И делать это с самого начала, то есть проверить гипотезу о нормальном распределении явки.
Потому что она:
1. может быть подтверждена
2. может быть опровергнута.
При этом опровергнута может быть по причинам:
1. естественным (поведение электората не соответствует нормальному распределению)
2. искуственным (например, злоупотребления в избирательных комиссиях).
Но поскольку нормальное распределение вы постулировали, а оно может оказаться неверным по естественным причинам), то все ваши дальнейшие "исследования" весьма сомнительны.

Re: Вот и приплыли к началу.

Вы правы. Нормальность распределения явки не следует из анализа данных выборов. Даже больше, данный анализ и не ставит целью доказать это или опровергнуть. Это методологическая основа, на основе которой и делаются последующие выводы.
Если у вас есть содержательные доводы по поводу существования факторов, искажающих нормальность распределения явки в Москве, скажем, наличие в числе сторонников ЕР групп с существенно различным поведением, выкладывайте.
Если таких соображений у нас нет, то по умолчанию предполагается гипотеза нормального распределения явки.
Кстати, вброс и является таким фактором, который этот анализ и пытается вычленить и исключить.

Re: Вот и приплыли к началу.

(Anonymous)
Это не методологическая основа, а недоказанный постулат.
Точно также можно постулировать, например, пуассоновское распределение.

Re: Вот и приплыли к началу.

Если можете, ссылочку дайте на авторитетов в этой области.

Кстати, как там у вас в СП-б с подобным распределением, вроде массовых вбросов не отмечено?

Re: Вот и приплыли к началу.

(Anonymous)
Бендат Дж., Пирсол А. Прикладной анализ случайных данных.

У нас в СПБ не отмечено выборов :-)

noputin.ru

(Anonymous)
1. Без дополнительной информации о распределении явки, например с предыдущих выборов, трудно сделать обоснованное заключение о величине вброса за ЕР.

Проблема в том, что не существует достоверной информации по явке по предыдущим выборам, по крайней мере, в Москве. Как некоторое приближение могу рекомендовать взять данные с участков, где использовались КОИБы, хотя, насколько я понимаю, и в 2007 на некоторых участках, и уж точно в 2008 фальсифицировались и они (http://noputin.ru/viewforum.php?f=40).

Более того, насколько я понимаю, есть "Решения" об использовании КОИБов. Официальной информации о том, использовались ли они на самом деле, нет (по крайней мере, мне она не известна).

  • 1
?

Log in

No account? Create an account