Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет Генрих Лейхтвейс ([info]dubadam)
@ 2005-12-06 17:45:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Настроение: good
Музыка:Михальчик - Лесной олень

Карла Фридриха Гаусса ющило и янучило..

Большинство сомнений в честности результатов выборов в Москве, громких и не очень, сводятся в основном к вбросу за Яблоко и вбросу за Шаврина против Квачкова.


Как-то раз в связи с выборами в Украине мне приходилось прибегать к великому критерию истины - закону больших чисел. А Москва, как и Украина, как раз кстати и людьми, и участковыми комиссиями обильна. И все необходимые цифры есть на тормозном сайте мосгоризбиркома.


Метод оценки вброса основан на следующих предположениях:
1. Существенная часть участковых комиссий работает честно.
2. Рассказы будто "нажатием кнопки голоса можно перекинуть от одного кандидата другому" отвергаются по причине детского сада. Основной технологией фальсификации признаются варианты вброса.
3. Там, где осуществляют вброс, количество левых бюллетеней велико по сравнению со средним отклонением: вбрасывать один процент бессмысленно из-за пункта 1, поэтому чтобы скорректировать результат хотя бы на проценты, необходимо вбрасывать от пяти процентов, на десяток процентов, смотря по команде.
4. Предполагается, что СНГшные политтехнологи пока не умеют совершать фальсификации, скрупулёзно соотнося размеры вбросов с требованиями теории вероятностей.


Идеальная Гауссова форма распределения в виде горы Фудзи убедит нас в кристальной честности выборов. Зато вбросы в пользу одного из кандидатов дадут заметный дополнительный пик в бОльшую сторону за этого кандидата; у его ближайшего конкурента за счёт этих участков появится пик в сторону мЕньшего числа голосов. Кроме того, на распределении явки появится пик в бОльшую сторону за счёт этих участков, где из-за вброса явка повысилась. Если есть третий кандидат, то на его графике будет та же картина. Трехгорбые картины распределения голосов за главных кандидатов свидетельствуют о вбросах за обе стороны - при этом график явки либо остаётся двугорбым в случае похожих стратегий вброса, либо сильно изрезан, если стратегий несколько.


Прошлый раз Украина дала нам классические картинки для учебника по фальсификациям. Посмотрим, что получается на Москве 2005 года.


Начну с Квачкова, за него больше процентов вброса кличут :)


Итак, округ 199 города Москвы, явка.


 18,48 КБ


Как человек, лично знакомый с Гауссом (и даже можно сказать что и с Шульбертом), заявляю прямо: это не Гаусс. Более того, можно наблюдать, как гауссов максимум сдвинут вправо процента на 3, потом ещё на 3 (то ли команда два раза прошла, то ли это подкидывали 6 процентов; и ещё один пик участков, где не стесняясь вбросили в среднем процентов десять. Сколько всего участков с вбросами? Много. Сколько вбросили и за кого? А вот сейчас посмотрим на главного пострадавшего - третьего кандидата ("против всех"), который при вбросах получает дополнительный пик с мЕньшей стороны.


20,58 КБ


ну вот, пик слева, да ещё какой. Это показывает, что вброс был в большинстве участков. Но не показывает, в чью пользу. А сколько всего вбросили? Смотрите сами, всего процентов 10 от числа проголосовавших. Кандидат "против всех" получил фактически около 21%, однако вбросы в пользу другого или других дали на этих участках в среднем 17-18%. Официальный результат кандидата "против всех" в 199 округе - 18,91%.

Для полноты картины дадим картины аутсайдеров. При таком малом количестве голосов у аутсайдеров вброс даже 100% не поколеблет классического гаусса:


25,18 КБ 18,33 КБ 20,32 КБ


Итак, гланые кандидаты.


19,88 КБ 23,15 КБ


Уважаемые читатели, знакомые с Гауссом, вместе со мной скажут: Нет, это не Гаусс. Это знакомая нам по центральной Украине трехгорбая картина вброса за обоих главных кандидатов. Вплоть до понижения главного максимума из-за вброса на большинстве участков. 4-5 процентов накидывали и 4-5 другому, на сравнимом числе участков, что и даёт по пику с обеих сторон от классической Фудзи. Вот такой результат. А вы что хотели :)


Итак, победил действительно Шаврин, а Квачков проиграл. При этом результаты их обоих завышены на несколько процентов.


Пользуясь случаем, выражаю благодарность:


1. Украине - за всё, за то что она есть, и за то что она, как и Москва, большая, прекрасный образец для пособий по статистике и выборным технологиям


2. Карлу Фридриху Гауссу, за то что он гений


3. Разработчикам программы Microsoft Excel


4. Мосгоризбирком за детальную информацию и деятелей сайта http://www.moscow_city.izbirkom.ru , хоть и тормозного, но представившего детальную информацию для несложного обсчёта в Excel.



(Добавить комментарий)


[info]sartac@lj
2005-12-06 06:47 (ссылка)
Спасибо, интересно. Но хорошо бы расширить список иных теоретических объяснений "за Квачкова".

(Ответить) (Ветвь дискуссии)


[info]dubadam@lj
2005-12-06 06:57 (ссылка)
Да, Гаусс не объясняет, он только устанавливает факт.

Закон больших чисел потому и закон, что не зависит от политических предпочтений того, кто подкидывает монету. Microsoft Excel также беспристрастен, и это счастье

Чтобы выпятить голый статистический факт, я сознательно не касался возможных теоретических объяснений.
Это предоставляется тем, кто владеет соответствующим аппаратом.

(Ответить) (Уровень выше)

Тут может быть нюанс
[info]most9d@lj
2005-12-06 12:42 (ссылка)
Изолятор "Матросская тишина" расположен на территории Преображенского округа. Там прилично избирателей. Вполне вероятно, что они голосуют совсем по-другому, чем в городе (если на них не давит администрация, то должны преимущественно за Квачкова). Эти участки (если их достаточно много) могут дать второй пик.

(Ответить) (Ветвь дискуссии)

Re: Тут может быть нюанс
[info]dubadam@lj
2005-12-06 19:31 (ссылка)
//Эти участки (если их достаточно много) могут дать второй пик.//
Конкретно по этому участку.

Вообще спец. так сказать участки легко выделяются. Кроме необычной цифры явки у таких участков необычная численность зарегистрированных избирателей.

Спасибо мосгорисполкому - он такие участки снабдил как специально явно выделяющимися номерами.

Например, на Преображенке обычные участки имеют номера от 1146 по 1167 и численность избирателей порядка 2100 - 2500 человек.

Три спец.участка на преображенке с номерами от 3195 по 3197 даны в конце таблицы по округу. Численность избирателей соответственно: 6, 5 и 360 человек.

Возможно тюрьма - это те 360 человек. Явка 100%. Проголосовали: Квачков 82 (23%), Шаврин 109 (30%), против всех 84 (23%). Они голосовали не сильно отлично от всего округа!

Всего на всей Преображенке явились 19792 избирателя. Те 360 составляют 1,8% от этого числа. На картину в целом 199-м округе это тем более не повлияло.

так что..

(Ответить) (Уровень выше)


[info]dmdrv@lj
2005-12-07 04:22 (ссылка)
"Есть ложь, есть большая ложь, а еще есть статистика..."

Что-то мне кажется, что не все так просто. Хотя идея очень интересная.
Надо подумать, посчитать :)

(Ответить)


[info]fizzik@lj
2005-12-09 00:13 (ссылка)
А вот я не понимаю. Гауссова кривая - это график распределения исходов некоего случайного процесса. Если бы избиратели, приходя на участок, кидали кубик и голосовали бы за того или иного кандидата в зависимости от выпавшей цифры, то график "процент голосов за кандидата Пупкина - количество участков" действительно был бы гауссовым. Но ведь в реальности дело происходит не так. Какой же процесс Вы в данном случае считате случайным, и почему Вы думаете, что он случаен?

Для сравнения. Допустим, мы измерим температуру всем пациентам всех больниц страны и построим график "температура - количестов пациентов". Будет ли он гауссовым? Я думаю - нет. Он запросто окажется двугорбым, с одним максимумом на 36,6 и другим - где-то повыше. Следуя Вашей логике, мы должны будем сделать вывод, что медсестры занимаются приписками :))

(Ответить) (Ветвь дискуссии)


[info]dubadam@lj
2005-12-09 00:30 (ссылка)
Да, там в дискуссии этот момент есть: мне надо было в списке априорных допущений объявить пункт: гауссова статистика относится к процессам ОДНОРОДНЫМ и близким к ним, ну как например подкидывание монеты.

Отсюда - берутся соседние участки в крупных городах.
Пример хорошего гаусса и по явке, и по кандидатам на весьма большом числе участков - Киев третий тур.

То есть: ДОПУСТИМ, что 197 участков в округе-199 города Москвы однородны в степени, сравнимой с разумным разбросом - как это было в Киеве. Тогда.. и так далее.

Зато конечно нельзя так обсчитывать в общей статистике к примеру всю Украину ввиду очевидной неоднородности))

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]fizzik@lj
2005-12-09 00:53 (ссылка)
Я думаю, что Ваше предположение об однородности неверно в обеих случаях.
Так что скорее нужно объяснять, почему в Киеве получилось гауссово распредление, а вот то, что в Москве оно не получилось - это как раз естественно.
ч
Соседние участки в крупных городах могут отличаться разительно по составу населения. Другое дело, что не всегда эти отличия найдут выражение в разных результатах голосования. Грубо говоря, различие между кандидатами могут оказаться "параллельны" отличиям между жителями двух микрорайонов. И тогда жители пижонской новостройки, огороженной забором и обставленной со всех сторон мерседесами, проголосуют также, как жители соседней заселенной алкашами полуразвалившейся хрущебы. В другом же случае отличия окажутся "перпендикулярны", и тогда эти две группы проголосуют совсем по-разному.
Видимо в Киеве был первый вариант. Но это не значит, что всегда должно быть так.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dubadam@lj
2005-12-11 19:35 (ссылка)
//Так что скорее нужно объяснять, почему в Киеве получилось гауссово распредление, а вот то, что в Москве оно не получилось - это как раз естественно//
ну так объясните.

Смотрите что Вы сказали: я 100 раз подкидывал монетку по 100 раз, выпадала решка в среднем 70 раз, и это естественно! и распределение оказалось негауссово, что тоже понятно! а вот если бы вышло 50 на 50 и гауссово, то это было бы странно и потребовало бы объяснений ))

Напротив. Если распределение получилось гауссовым, но это как раз не требует специального объяснения. Или требует, если нашлись и приведены существенные факторы, которые были обязаны сделать распределение негауссовым, а оно оказалось гауссовым.

//Грубо говоря, различие между кандидатами могут оказаться "параллельны" отличиям между жителями двух микрорайонов. И тогда жители пижонской новостройки, //
Да, это обстоятельство существует и давно известно. Осталось оценить его влияние в данном случае.
Я думаю так: когда в содержании выборных скандалов присутствует социальные факторы, тогда это включается. Это является объяснением всегдашнего большого разброса у яблочников, которые понятно имеют различную поддержку в хрущобе и студенческой общаге.
А здесь интрига была обращена на Квачкова - фактор в общем-то внешний для конкретных участков. Понимаете, одинаково внешний. И так же н-рно в Киеве оказались главными факторы, далёкие от противоречий хрущоб и элитных домов.
Вот и..

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]fizzik@lj
2005-12-12 08:18 (ссылка)
что Вы сказали: я 100 раз подкидывал монетку по 100 раз, выпадала решка в среднем 70 раз, и это естественно

Возвращаемся к моему первому комменту: голосование не есть случайный процесс, поэтому подобная аналогия неверна.

И так же н-рно в Киеве оказались главными факторы, далёкие от противоречий хрущоб и элитных домов.

Различие в материальном положении - только одна из граней, и действительно часто важно не это различие, а какие-то другие. Еще избиратели бывают молодые и старые. Русские и нерусские. Образованные и необразованные. Занятые в частном секторе и в госучереждениях. И т.п. Нет априорных оснований утверждать, что по каждому из этих (и множества других) параметров население распределено равномерно. То, что мы не знаем, как именно подобные различия отражаются на результатах голосования, и какой из параметров оказался важным в случае Квачкова или в каком-то другом - не повод отрицать влияние различия состава населения на результаты голосования и постулировать "случайность" результатов. Они не случайны, они закономерны, просто эта закономерность нам неизвестна.
Почему в Киеве получился гаусс, а в Москве нет? Помимо простого и общего (но неконкретного) ответа, что население Киева оказалось распределено достаточно равномерно по тому неизвестному нам параметру, который был наиболее важен для отношения к Ющенко/Януковичу, могу предложить еще одну версию.
Дело в том, что украинские президентские выборы вызывали гораздо больший интерес, чем нынешние московские (что видно и по явке). Следовательно - в Киеве намного бОльшая доля избирателей, живущих не по месту своей прописки, тем не менее сподобились доехать до участка. (Кстати, и заметно меньшие размеры города тоже облегчают это, по сравнению с Москвой). В обоих городах не по месту прописки живет очень заметная доля жителей, думаю - десятки процентов. При этом отличия в составе населения районов, если рассматривать в качестве места жительства именно место фактического проживания - намного сильнее, чем если под местом жительства понимать прописку. Например, сложно себе представить преуспевающего бизнесмена, фактически проживающего в хрущебе в Капотне, но абсолютно запросто представить - этого же бизнесмена, в этой же хрущебе прописанного. По местам прописки население разбросано намного более равномерно, хотя бы потому, что сами эти места в значительно большей степени "случайны", чем более осознанно выбираемое место фактического проживания. Так вот в Киеве результаты были "уравнены" такими "мигрантами", не поленившимися приехать в район своей прописки для того, чтобы проголосовать. В Москве же на этих выборах вряд ли кто-то поехал голосовать из Измайлово в Ясенево и наоборот. В результате голосовали только те, у кого фактическое место проживания с пропиской совпадает, и различия районов по составу населения имели шанс проявиться в полной мере.

P.S.
Я нисколько не сомневаюсь, что на московских выборах могли жулить. И, в принципе, верю, что можно выявить это жульничество Вашим методом. Но вот пределы его применимости мне непоянтны. Я не могу согласиться с утверждением, что "результаты любых выборов дорлжны быть гауссовыми".

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kuk245@lj
2005-12-12 19:03 (ссылка)
Несколько замечаний о случайности голосования.
Рассмотрим явку на избирательный участок. Если это неслучайная величина, то можно до голосования сказать, сколько придет избирателей. При использовании всех рычагов давления на избирателей трудно получить либо 0, либо 100%. Получиться что-то между. Значит, есть избиратели готовые придти на выборы в любом случае, а также те, кто придет если: не включит телевизор, не придут гости и т.д. Даже если произвести предварительный опрос избирателей, то все равно явка будет отличаться от прогноза хоть на несколько голосов.
Пределы применимости вытекают из выполнения условий центральной предельной теоремы(в словесном виде их приводил). В теории вероятности эта теорема доказана. Строго математически доказать их выполнение на выборах возможно, если провести полное обследование всех избирателей (это круче чем перепись - в один день всех опросить).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]fizzik@lj
2005-12-13 02:13 (ссылка)
Если в день выборов показывали интересный фильм, и поэтому включивших телевизор, засмотревшихся и не пошедших голосовать оказалось больше, чем "должно было бы быть" - это случайность или закономерность?
А если этот фильм показывали по кабельному каналу, который доступен только на половине участков, и поэтому на этой половине явка оказалась устойчиво ниже, чем на другой - не "заянучит" ли от этого Гаусса?
Кстати, есть определенные сомнения в том, что выполняется условие независимости событий. Например: муж и жена прописаны по разным адресам (а живут, естественно, вместе). С очень большой вероятностью они либо вместе пойдут, либо вместе не пойдут голосовать. Т.е. решение может и случайное, но коснется оно двух участков одновременно, и таким образом есть взаимозависимость между цифрами явки на этих двух участках.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kuk245@lj
2005-12-13 19:24 (ссылка)
Явка будет состоять из суммы детерминированной и случайной составляющей, их соотношение не имеет никакого существенного значения. Кто-то мог и не включить телевизор, или другие личные события в жизни конкретного избирателя способны повлиять на его решение. Важно, что не возможно определить заранее точно явку,с неслучайной величиной это не так, она известна до события.Зависимость явки избирателей на разных участках означает следующее: “Избиратель Иванов, голосующий на участке А, придет только тогда, когда придет Сидоров, голосующий на участке В. И наоборот, Сидоров придет только тогда, когда придет Иванов. И это должно выполнятся для большей части избирателей участков А и В, а их около 2 тысяч, территориальных их еще больше.”

(Ответить) (Уровень выше)


[info]kuk245@lj
2005-12-09 19:15 (ссылка)
То, что выборы в СНГ фальсифицируют - это все знают.
Вопрос в другом, как это изменяет реальный расклад сил?
Какой был реальный процент в Москве по партиям?
Задача состоит в том, чтобы используя первое предположение
произвести корректировку выборки (отброс малого числа фальсифицорованных результатов) и получить заветную Гауссову форму распределения.
По виду кривой распределения можно делать вывод только о возможных корректировках выборки. Все остальное ненаучно, то есть Гаусс здесь не причем, так как он был ученым.
Несколько комментариев.
"Великий критерий" закон больших чисел здесь не причем. Он гласит о сходимости
при определенных условиях суммы независимых случайных величин к сумме их средних.
Но он молчит обовсем остальном.
Хотя здесь возможно применима центральная предельная теорема.
Которая говорит о том, что сумма независимых случайных при определенных условиях
будет стремится к Гауссовой форме распределения.
Немного теории, чтобы было около научно.
Результат на участке значение случайной величины. Ее значение могло быть чуть другим,
при чуть других событиях. К примеру, по дороге к участку кого-то могла сбить машина и т.п. Значит у нее есть средняя и дисперсия.
Условие получение Гауссовой формы распределения:
1) Независимость случайных величин (результатов участков) - выполняется.
2) Наличие большого числа случайных величин - выполлняется.
3) Отсутствие преобладающе преобладающего слагаемого (не Гауссового) - выполняется.
Однородность выборки не требуется, даже для неоднородных будет Гаусс,
если нет преобладающего и много случайных величин.

(Ответить) (Ветвь дискуссии)


[info]dubadam@lj
2005-12-11 19:40 (ссылка)
Согласен по всем пунктам.

(Ответить) (Уровень выше)


[info]kuk245@lj
2005-12-12 19:02 (ссылка)
Кстати, провел тоже обсчет московских выборов. Скоро тисну на LiveJournal статейку о возможной методологии обработки итогов выборов. Краткое резюме. Явка завышена на 0,7%, что не повлияло существенно на расклад сил. Выборы в 199 округе более фальсифицированы. Явка завышена на 3%, преобладал вброс за Шаврина. Возможно, он победил с перевесом 1-1,5%, за Квачкова реально проголосовало 31% избирателей.

(Ответить) (Ветвь дискуссии)


[info]dubadam@lj
2005-12-12 19:13 (ссылка)
о как, результат одинаковый.
Будет занимательно, если он получен совершенно отличным независимым методом.

(Ответить) (Уровень выше)


[info]kuk245@lj
2005-12-15 18:45 (ссылка)
Наконец, случилось, появилась статейка о возможной методологии обработки итогов выборов.
http://www.livejournal.com/users/kuk245/1157.html Заходите, читайте, коментируйте. Милости прошу.

(Ответить)

А что еще можно почитать по этому поводу?
[info]yurayu@lj
2006-01-05 09:52 (ссылка)
Например, по партиям Вы картинку смотрели, или нет?

(Ответить)