Берг отрастил «бороду Чурова» Часть 1
Текст написан в соавторстве с Денисом Веркашанцевым
Еще до губернаторских выборов мы обещали провести статистический анализ итогов голосования. Цель – математическими и статистическими методами установить наличие или отсутствие аномалий, могущих свидетельствовать о применении разного рода манипуляций в процессе голосования. Мы выполнили наше обещание и презентуем вам, дорогие читатели, наши наблюдения и выводы.
Почему мы решили это сделать?
Статистичеcкий анализ данных итогов голосования начал активно применяться общественностью в 2011 году, после выборов в Госдуму РФ. Именно тогда рядовой обыватель узнал об избирательных «технологиях», ранее знакомых узкому кругу посвященных, политтехнологам и специалистам «черного PR», — «каруселях», «хороводах», «участках-дублерах», «вбросах» и переписывании протоколов. Именно тогда родился популярный по сей день интернет-мем «146%» и многие другие.
Если видеозаписи, свидетельства очевидцев, документы можно дезавуировать, нужным образом интерпретировать, подделать, списать на случайность или объявить несущественными, то аргументы одного из «свидетелей» — математики – подвергнуть сомнению довольно сложно.
Результаты голосования на выборах 2011 года были подвергнуты энтузиастами математическому анализу (одна из публикаций — http://esquire.ru/elections) , который убедительно продемонстрировал наличие аномалий, могущих являться следствием разного рода манипуляций с голосами избирателей – вбросов, приписок, голосования под административным давлением. Иного логического объяснения обнаруженные закономерности не имеют. Хотя сторонниками власти и ЕР в многочисленных дискуссиях выдвигались различные аргументы и объяснения, они остаются маловероятными и весьма спорными (иногда они сводятся к традиционному тезису «у России свои индивидуальные особенности», или даже к тому, что матанализ выборов ни о чем не говорит, просто потому что… ни о чем не говорит).
Доверие к власти, подорванное выборами 2011 года, у значительной части избирателей не восстановилось до сих пор. Поэтому мы решили проанализировать результаты голосования 14 сентября 2014 года в Оренбуржье, чтобы убедиться, считает ли власть оренбуржцев достойными самим делать свой выбор или по-прежнему предпочитает устраивать миграции галочек в наших бюллетенях.
Юрий Берг VS Карл Гаусс или «борода Чурова»
Первый использованный нами метод — так называемый метод нормального распределения (или «распределения Гаусса»), суть которого заключается в закономерности распределения случайных величин.
Объясним «на пальцах». Например, если мы измерим рост всех жителей Оренбурга, то у нас получится определенный массив данных. Из него мы сможем определить средний рост, и окажется, что средний рост — это и есть среднестатистический рост, т.е. людей среднего роста будет большинство, а чуть пониже и чуть повыше — чуть поменьше, людей маленького и большого роста будет ещё меньше, а людей очень маленького и очень большого роста будет совсем мало. Людей с аномально высоким и аномально низким ростом не будет вовсе – их число стремится к нулю. Таким образом, графически статистическое распределение роста оренбуржцев будет представлять собой кривую, напоминающую формой колокол – т.н. «гауссиану», это и есть «нормальное распределение». В реальной жизни она может быть не совсем идеальной, к тому же на это оказывает влияние размер массива данных – при меньших числах выборки может возникать больше случайных отклонений.

Аналогичную гистограмму можно выстроить для результатов голосования на выборах. Для этого по вертикальной оси мы откладываем количество избирательных участков (УИКов), а по горизонтальной – процент голосов, полученных на них кандидатом. Каждая точка на графике, таким образом, будет показывать количество УИКов, на которых кандидат получил определенный процент голосов. Для анализа мы использовали данные с официального сайта избирательной комиссии Оренбургской области.
Вот, например, как выглядит гистограмма распределения процентов, полученных кандидатом Ю.А. Бергом на всех УИКах Оренбургской области:
В принципе, ничего экстраординарного – полученная форма вписывается в гауссовский «колокол». Некоторое смещение вправо, в сторону увеличения процента, не настолько аномально, чтобы с ходу считать его результатом каких-либо манипуляций, но, тем не менее, может и свидетельствовать о них – в незначительных объемах. Все в целом вписывается в характер случайного распределения. Но обращает на себя внимание факт, что на шести избирательных участках кандидат получил ровно 100% голосов избирателей. Это может свидетельствовать как о том, что остальные кандидаты совсем неизвестны избирателям на этих участках, так и о контролируемом голосовании – например, в военной части или бюджетном учреждении.
Но все же прослеживается первая странность. Акценты на ровных значениях превращаются в закономерность: кандидат получил ровно 100% голосов избирателей на шести избирательных участках, ровно 90% на двух участках, ровно 80% на шести участках.
Такое же пристрастие к круглым показателям демонстрируют результаты явки избирателей. Число участков, где явка была выше среднего по области и составила круглое число процентов, странным и явным образом превалирует над остальными:
Число участков с явкой 50%
Число участков с явкой 60%
Число участков с явкой 70%
Число участков с явкой 75%
Число участков с явкой 100%
Вероятность случайности в этой закономерности крайне низка. Логичнее предположить, что мы имеем дело с проявлением каких-либо манипулятивных действий – вбросов, фальсификаций итоговых протоколов и т.п.
Без особых аномалий, выглядят гистограммы областного голосования за других кандидатов, например, Митина и Титовой:
Но посмотрим внимательнее на результаты голосования по Оренбургу. Гистограммы голосования на УИКах областного центра выглядят интереснее. Вот графики кандидатов-аутсайдеров Митина, Сагритдинова, Титовой и Широковой:
Все они в целом вписываются в форму нормального распределения (гауссиана Митина вообще практически идеальна). Незначительные отклонения объяснимы с точки зрения небольшой величины массива анализируемых данных (всего в Оренбурге 210 избирательных участков) и допустимых при этом случайностей. Объяснимы и имеющиеся у всех кандидатов отстоящие от основного «колокола» единичные участки с максимальными для них значениями – очевидно, это «родные» для кандидатов участки, где они проживают, где голосовали их коллеги или соседи, где их знают лично и т.п.
Во второй части мы расскажем о более интересных нюансах анализа результатов губернаторских выборов.