Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет bbb ([info]bbb)
@ 2005-04-20 10:14:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Анализ украинских выборов
Андрей Кунов, Алексей Ситников, Дмитрий Шакин "Россия и Украина: нерегулярные результаты регулярных выборов"
http://openecon.ru/news.asp?ob_no=713
http://openecon.ru/attach.asp?a_no=521


(Добавить комментарий)

(Комментарий удалён)
Re: страно что не ссылаются
[info]bbb@lj
2005-04-20 11:55 (ссылка)
Как же не ссылаются??? Номер шесть в списке литературы. Более того, предстоящая статья в пост-совет подписана не только Ордешуком и Мягковым, но и Шакиним, одним из авторов данного материала. Она у меня есть.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(Комментарий удалён)
Re: страно что не ссылаются
[info]bbb@lj
2005-04-20 15:09 (ссылка)
Ну, что касается кросс-ссылок, то это их проблемы, а не наши. В МОШ (у меня - на стр. 15) прямо говорится, что методология "перетока голосов" изложена в работах Мягкова и Шакина (2005) и Мягкова, Ордешука и Смирнова (2005), причем первая из них, если внимательно посмотреть на список литературы, оказывается на самом деле работой Мягкова, Ситникова и Шакина, а при изучении сайта института открытой экономики надежно аппроксимируется работой http://openecon.ru/seminar.asp?ob_no=559

Вообще же, пролистав обе эти статьи, могу сказать, что они позволяют, конечно, не посчитать fraud, а всего лишь выявить подозрительные на fraud точки, причем в реальности подозрительное поведение может объясняться и легитимными факторами.

Метод распределения явки - более убедителен и красив (так что если его придумал именно Ордешук - это не случайно), метод перетока - гораздо менее надежен, хотя тоже интересен.

Далее, про Ющенко - в моем экземпляре МОШ, на странице 28, говорится, что "подозрительных" голосов в третьем туре в его пользу они насчитали от 128 до 711 тысяч. Причем дальше, на той же и следующей страницах, идет какое-то невнятное рассуждение, смысл которого я не вполне уловил, но, по-моему, они хотят сказать, что фрадулентность этих голосов им самим не очевидна.

Про 14 миллионов в пользу Путина в МОШ - очевидная халтура (как и про Ющенковские миллионы в КСШ). Ясно ведь, что введенное авторами понятие "нерегулярных голосов" никоим образом не тождественно "фальсифицированным голосам". Неужели в журнале этот кусок не поправят, не потребуют переписать? Если вы читаете журнал, то расскажите, пожалуйста.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(Комментарий удалён)
Re: страно что не ссылаются
[info]bbb@lj
2005-04-20 19:36 (ссылка)
На самом деле можно и не убирать, но сопроводить всякими дисклаймерами.

Что метод сам по себе не служит доказательством фрода, должно быть ясно с самого начала.

Утверждение о законе распределения явки по участкам все-таки некое эмпирическое подтверждение имеет (они вот на Литве демонстрируют), но все упирается в правильное разделение участков на однородные кластеры. Они делят их априорно и усматривают в нарушении нормальности подозрительность, хотя можно идти и наоборот - усматривать в таком нарушении неправильность разделения.

Что эта ненормальность, тем не менее, служит хорошим индикатором при выборе точек для внимательного вглядывания и разглядывания - это факт. Картинка 1 в МОШ и ее интерпретация - вполне убедительны. То есть подозрительны не сами по себе участки с высокой явкой, а участки с ИСТОРИЧЕСКИ НЕОЖИДАННОЙ высокой явкой.

Наконец, что метод перетока очень спекулятивен и не может служить основанием для категорических выводов типа того, что они делают про Путина - тут и спора быть не должно. Удивляюсь, как это Ордешук не понимает. Можете передать ему, что для меня (который относится к нему с большим уважением) этот кусок МОШ, как минимум, неубедителен. Может быть, в нем и содержится своя сермяжная правда, но тогда ее надо отдельно раскрывать - в частности, эксплицитно обсуждать именно тот случай, когда поддержка избирателей между турами меняется. Ведь стандартная ситуация предполагает, что во втором туре реальный выбор делают только те, кто в первом проголосовал за кандидатов номер три, четыре и т.д. - они выбирают из номеров один и два - а электорат двух победителей первого тура неизменен. Очевидно, что в украинских выборах это допущение как минимум требует отдельного доказательства.

Точно так же и считать думские выборы ВСЕГО ЛИШЬ праймериз президентских (и строить на этом свою теорию) - не более чем тестируемая гипотеза.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: страно что не ссылаются
(Анонимно)
2005-04-21 04:49 (ссылка)
Доброе время суток.

Я почитал ваши комментарии и позволю себе на них ответить как один из соавторов этих работ (Дмитрий Шакин).

Сначала я хотел бы ответить по поводу тех заявлений, которые выглядят наиболее странно. Во-первых, было заявлено (только никому не говорите), что review в Post-Soviet Affairs не было. Это -- неправда. (поверьте мне, как одному из авторов это лучше знать). Во-вторых, мне очень странно было прочитать фразу "хотя знаю точно что графики явки избирателей были сделаны Ордешуком и про нормальное распределение явки это его идея". Это -- ложь. Графики явки строил я лично (Для России это было еще прошлым летом), до того, как мы начали работать с Михаилом Мягковым. Это факт вы можете подтвердить также и у Михаила Мягкова.

Вопрос ссылок: так как публикация на сайте Института открытой экономики не является официальной публикаций (равно как и виденный вами draft МОШ), то некоторая путаница в ссылках объяснима. Все это будет исправлено в финальных версиях.

Вопрос плагиата: Обе работы являются частями одного большого исследования, проводимого авторами (Кунов, Шакин, Ситников, Шульгин, Мягков, Ордешук). Как
вы могли заметить, статьи различаются следующим: в МОШ сделан упор на примеры
и оценки размера нерегулярностей, в то время как в КСШ упор сделан на более детальное описание методов (в частности сравнение с Литвой) и (статистически) аккуратное представление результатов (работа в этом направлении продолжается). Кроме того, к моменту написания последней стали известны более детальные данные для Украины, которые там и использованы. Что касается замечания о том, что методы являются калькой друг друга, то это и неудивительно, потому что они есть часть одного и того же исследования. Более того, самый сложный метод -- переток голосов -- вынесен в отдельную работу.

Теперь я хотел бы ответить на некоторые из возникших в дисскуссии вопросов (большей частью методологических). Если вы внимательно читали работу (КСШ), то там явно указано, что нерегулярности -- это не фальсификации (т.е., противозаконные действия). Понятие нерегулярностей значительно шире. В этой работе _нигде_ не утверждается что за нерегулярности можно посадить Ющенко, Януковича или кого-то другого.

Нормальность распределения: об этом говорится, но основной аргумент метода распределения заключается в динамике -- быстрое изменение формы изменения явки маловероятно (например, появление второго горба). В этом bbb был абсолютно прав, заметив, что "То есть подозрительны не сами по себе участки с высокой явкой, а участки с ИСТОРИЧЕСКИ НЕОЖИДАННОЙ высокой явкой".

Метод перетока голосов: в этом методе не делается _никаких_ априорных предположений о перетоке голосов от кандидатов первого тура к кандидатам следующего. В частности, фраза "Ведь стандартная ситуация предполагает, что во втором туре реальный выбор делают только те, кто в первом проголосовал за кандидатов номер три, четыре и т.д. - они выбирают из номеров один и два - а электорат двух победителей первого тура неизменен. Очевидно, что в украинских выборах это допущение как минимум требует отдельного доказательства." несколько не по делу. И по поводу Ющенко, и по поводу Януковича: их избирателям первого тура методом перетока разрешается уйти куда угодно, например, остаться дома во втором туре. Также не по делу критика относительно
"считать думские выборы ВСЕГО ЛИШЬ праймериз президентских (и строить на этом свою теорию) - не более чем тестируемая гипотеза". Методу перетока абсолютно все равно, от каких групп к каким изучать переток. Например, в США такие методы (их относят к Ecological Inference) любят применять для нахождения доли чернокожих, которые голосовали за демократов.

Дмитрий Шакин

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: страно что не ссылаются
[info]bbb@lj
2005-04-21 10:20 (ссылка)
Как вы видели, проблемы взаимоотношений между соавторами, а также между соавторами и журналом - меня совершенно не волнуют; я с самого начала был уверен, что вы все работаете вместе и вполне гармонично, что никакого плагиата внутри вашей группы нет. Что все эти тексты суть разные срезы одной большой работы - также совершенно очевидно. Так что здесь никакой проблемы не существует.

Что меня волнует, так это исключительно интерпретация полученных графиков и картинок. Да, у вас нигде так прямо не говорится, что "нерегулярность" - это фальсификация, но читателю совершенно очевидно, что именно это и подразумевается. Может быть, вы этого не хотели, но это и есть то впечатление, которое создается. Сужу не по себе, а по другим.

Ну вот посмотрите - в МОШ обсуждение русских выборов 2004 года завершается такой фразой:

Since 48 million abstained in 2003, Putin ostensibly won 48x.24 = 11.5 million votes from the ranks of nonvoters or from "voters" who were simply created to facilitate his victory. If we add to this the estimate that he also gained an additional 14% of United Russia's vote over and above what is actually won, or 3.2 million additional voters, we see that Putin won 11.5 + 3.2 = 14.7 million new or previously unaccounted-for votes - an impressive mobilization of support to say the least.

И к этом добавляется сноска номер 8:

Even this number may be an underestimate, since it does not take into account the possibility that the votes Putin ostensibly won from those who had previously voted for Zyuganov, Yavlinsky and Zhirinovsky were not fabricated as well.

Что происходит некий нетривиальный процесс - это да, это доказывается. Что он сводится к фальсификации - нет. Что фальсификация имела место - думаю, никто не сомневается, но вот что она сыграла решающую роль в этой нерегулярности - ваши методы доказать не могут. Не сомневаюсь, что вы и сами это прекрасно знаете, и даже, наверно, где-то упоминаете, но так как материя сия исключительно политизирована, то мой совет - повторять этот дисклаймер почаще, выделять шрифтом и интонацией, объяснять и растолковывать.

Мне казалось бы интересным, в этой связи, попробовать "оторваться" от проблематики нерегулярности и гипотетической фальсификации и попробовать вычислить динамику поддержки Путина в "русской" России, более однородной. Ваши методы позволяют вычленить нерегулярные регионы (как я понимаю, вы провели такое вычленение изначально, априорно - разделив Россию на республики и все остальное). Вот их бы я в аналитических целях оставил за пределами такого исследования. Черт его знает, что там происходит и как надо рассматривать неформальные, полу-административные методы давления на избирателя, где там разница между фальсификацией, использованием административного ресурса и традиционным патернализмом. Достаточно сказать, что это другая модель демократии, и постараться не смешивать две разные модели в одну кучу.

Касательно перетока - мне показалось, что весь пафос вашего анализа состоит в том, что перетоки служат инструментом выделения нерегулярностей, а нерегулярности имплицитно идентифицируются с чем-то, очень близким к фальсификации. И вот тут критическое значение приобретает упомянутая мной гипотеза о неизменности предпочтений голосовавших за тех кандидатов, которые вышли и в первый, и во второй тур. Если эта гипотеза (традиционно верная) в каком-то случае не подтверждается, вся методика поиска нерегулярностей приобретает совершенно другой оттенок.

(Ответить) (Уровень выше)

(Комментарий удалён)
Re: страно что не ссылаются
[info]bbb@lj
2005-04-23 03:12 (ссылка)
Техническое разъяснение: с целью недопущения бессмысленных флеймов в моем ЖЖ используется опция, при которой только комменты от юзеров-френдов становятся видны автоматически. Все остальные комменты, включая анонимные, изначально оказываются заскринены. Абсолютное большинство их я расскриниваю, расскринил и ваши. Если в будущем вы не захотите такого расскринивания, напишите - и я все оставлю как есть, но тогда ваши комменты не будут видны тем, к кому вы их обращаете (кроме меня, естественно).

(Ответить) (Уровень выше)

Re: страно что не ссылаются
(Анонимно)
2005-04-23 05:22 (ссылка)
To federalism: Я надеялся, что из первого моего ответа вам ясно, что у меня нет желания с вами общаться. Если вы не смогли этого понять, то я вам еще раз объясню. Во-первых, вы распространяете явную ложь (то, что вы думали, что это private discussion -- говорит о вас еще хуже). Во-вторых, человек, который начинает критику чего-либо со слов типа "это полный бред" вообще не достоин того, чтобы ему отвечали. Мой ответ -- лишь опровержение вашей лжи. Остальная его часть (ответ bbb по существу методов) вообще вас не касается.

To bbb: Я хочу извиниться за то, что эта неприятная дискуссия развернулась в вашем журнале. Надеюсь, что этот мой пост ее закроет. Что касается вашей критики по поводу связи нерегулярностей и фальсификаций, то мой ответ таков: да, не все нерегулярности являются фальсификациями [хотя в статье в НГ, написанной без нашего ведома, их отождествили]. При этом, мы считаем, что нерегулярности (т.е. отклонения от свободного волеизъявления граждан) плохи, даже если они не являются фальсификациями, так как приводят к отклонению результата выборов от "свободного выбора". Именно поэтому, весь объем нерегулярностей оценивается нами в тексте статьи негативно (а не только те голоса из этого объема, которые были фальсифицированы). Про переток: если вы посмотрите на Литву, то там эта гипотеза (о перетоке к кандидатам второго тура) полностью подтверждается, хотя она не является _априорным_ предположением метода. А в России и на Украине -- это нарушается (хотя формально метод разрешает этому перетоку быть в честных рамках). Это и дает повод говорить о нерегулярностях и оценить их масштаб.

Дмитрий Шакин

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: страно что не ссылаются
[info]bbb@lj
2005-04-23 10:21 (ссылка)
Дмитрий, спасибо за ответ.

По форме - я не вижу в этой дискуссии ничего особенно неприличного. В ЖЖ нравы несколько проще и прямее, чем в формальной академической среде, излишней чопорностью здесь никто не страдает. Главное же - что разговор сразу переехал на содержательные проблемы.

Насчет отождествления нерегулярностей с фальсификацией: журналист НГ в целом адекватно пересказала вашу работу, и если она допустила такое отождествление (а я знаю и других, понявших вас именно таким образом) - значит, проблема не столько на ее стороне, сколько на вашей. Вы не могли не понимать, что эта проблема слишком политизирована, чтобы не задумываться о таких возможных интерпретациях. Я уже процитировал МОШ - сарказм в английском тексте очевиден, его восприятие, ведущее к упомянутому отождествлению так же очевидно. Даже сейчас вы прямо говорите, что нерегулярность - это плохо, то есть вносите оценочные категории, заранее зная, что есть "правильное волеизъявление", а что нет. Мне, читателю ваших текстов, это вовсе не так очевидно.

Про переток в Литве - я посмотрю это внимательнее в понедельник (бумаги остались в офисе).

(Ответить) (Уровень выше)

Re: еще раз простите
[info]federalism@lj
2005-04-23 12:20 (ссылка)
Дмитрий, я прошу прощение за «бред», особенно если Вас это обидело. Я признаю что мог ошибиться и неправильно понять Ордешука (в мае извинюсь и перед ним), еще раз простите. Однако Я думаю тема настолько важно, что можно на время забыть обиды и личные неприязни. Трудно придумать еще один пример того насколько научная работа может оказатся общественно значимой, особенно по прошедствии времени. Поэтому так важно быть уверенным и точным в сделанных выводах. Поскольку мало в мире людей, способных и готовых разбираться в тонкостях вашего анализа, и особенно в его статистических тонкостях, я считаю своими гражданским долгом (звучит смешно, понимаю) поддерживать такое обсуждение. Заметьте, что, пока к нашей дисскусии никто не присоединился.
Как Вы знаете, в 1993 году физик А. Собянин объявил, что ратификация новой Российской Конституции была фальсифисирована. Основания для такого утверждения были чисто математические, построенные на каких-то формулах. Собянин объяснял что фальсификации следуют из отклонения результатов выборов от какого-то всеобщего закона. По этому закону, две партии (два кандидата), не могут получить слишком близкое число голосов. Если же они получают близкие результаты, значит это фальсификации. Так, зная результаты выборов для любой страны (из энциклопедии), Собянин брался немедленно выявить фрод и его подсчитать. Буквально, получив из аудитории пять цифр, Сан Саныч чертил два графика на доске – офиц результаты и ожидаемые из его закона, и объявлял, что отклонения двух линий есть свидетельство фальсификаций. Тут же, «на оборотной стороне конверта», подсчитывал милионные фальсификаций. Это было бы смешно, если бы это не было так важно для будущего нашей с вами страны. Через несколько лет Собянин умер, и от Собянинских расчетов осталась только красивая легенда, что кто-то как-то доказал факт фальсификаций в 1993 году. Эта легенда перекочевала во все учебники российской современной политической истории. Теперь ужен икто не помнит и не знает почему Собянин сделал такой вывод, но все помнят что Российская Конституция была фальсифисированна и это было доказано. Значит эта Конституция нелегитимна. А согласитесь, Дмитрий, это очень опасно для страны в которой мы с вами живем. Ведь в случае серьезного политического кризиса, именно этот аргумент может стать решающим обоснования в глазах населения отказа от Конституции. Тот или иной политик, с экрана телевизора объявит об своих неконституционных действиях, мотивируя необходимость новой Конституции, потому что прежняя была фальсифицированна и это было доказано учеными. Теперь вот Вы заявили что для Ющенко фальсифицировали голоса, но меньше чем Януковичу. Представляете как это может быть использованно противниками Ющенко в Украине – нет, не сейчас, когда все помнят как это было, а через пять лет или десять. Согласитесь, надо быть очень осторожным с выводах и с анализом. Принять во внимание как политики прочитают ваш текст.
Такой длинный пост, и все то для того что бы призвать вас обсудить вашу работу. И начать с обсуждения точности вашего метода для выявления нерегулярностей. Насколько велика ошибка вашего вашего метода для выявления нерегулярностей – так сказать ошибка первого и второго рода. А уже если мы знаем нерегулярности, насколько точны могут быть оценки фальсификаций полученные на основе установленных нерегулярностей. Ведь вы говорите только о нерегулярностях, не о фроде – я это понимаю. Но важно оченить не только точность вашего метода оценки нерегулярностей, но и точность возможных попыток делать на основании неругулярностей выводов о фальсификаций. И просто здорого, что вы не согласны с интепретацией данной журналисткой НГ. А давайте здесь обсудим «правильную» интепретацию вашей работы и вы сами опубликуете это в НГ ! Или, хотя бы давайте здесь, в журнале bbb попытаемся сохранить дисскусию этой правильной интепритации – так что у будущих историков российской политики будет возможность получить данные из первых рук.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: еще раз простите
[info]bbb@lj
2005-04-23 14:21 (ссылка)
Собственно, вот оно:

1) Собянин и Суховольский - http://www.hrights.ru/text/sob
2) Филиппов и Ордешук против Мягкова и Собянина - http://www.demokratizatsiya.org/Dem%20Archives/DEM%2005-01%20filippov.pdf

(Ответить) (Уровень выше)

Re: еще раз простите
[info]bbb@lj
2005-04-23 14:22 (ссылка)
Точнее, даже так:


1) Собянин и Суховольский - http://www.hrights.ru/text/sob
2) Филиппов и Ордешук против Мягкова и Собянина - http://www.demokratizatsiya.org/Dem%20Archives/DEM%2005-01%20filippov.pdf
3) Ответ Собянина - http://www.geocities.com/CapitolHill/2568/s_reply.html

(Ответить) (Уровень выше)

Re: еще раз простите
(Анонимно)
2005-04-24 05:02 (ссылка)
Если вы считаете себя знатоком методологии Собянина, то вы знаете, что у него было несколько методов выявления нерегулярностей (он все нерегулярности считал фальсификациями, но это его личное мнение). Мы использовали лишь один, да и то пришлось его модифицировать для учета неоднородностей (у нас он фигурирует как ПДИ). К другим частям его методологии (например, закону Парето у меня скептическое отношение, вероятно, в своем посте вы его и имели в виду). К ПДИ мы прибавили еще другие методы -- распределение явки и переток голосов.

Если бы внимательно прочитали аналитический доклад с нашего сайта, то несомненно бы поняли, что все наши утверждения о наличии нерегулярностей основаны на проверенной нами их статистической значимости. Я вообще на понимаю (как математик), как можно что-либо утверждать о статистически незначимых результатах. Так, превышение перетока над 100% наблюдается и в Литве (например, 102% от Пауласкаса к Паулаускасу), но при обсуждении этого момента тексте указано, что это отличие не является стастически значимым (найдите это место и убедитесь). А вот в России и на Украине это превышение является значимым (даже на 99% уровне -- прочитайте текст и убедитесь, что там это сказано). Как я написал в своем первом посте, в КСШ сделан упор именно на статистическую аккуратность результатов. Но при этом заметил, что работа в этом направлении еще продолжается. Все таблицы перетоков (каждый коэффициент) будут сопровождены доверительными интервалами. Сейчас они там не приведены, но при этом весь разговор ведется только о _статистически значимых_ нерегулярностях (по-другому и быть не может). Что касается статистической значимости ПДИ, то тут вообще разговор о значимости идет на каждом шагу. Даже карты построены не по точечным оценкам, а по квантилям распределения, которые как раз и показывают статистическую значимость.

Что касается публикаций в прессе, то мы (Андрей Кунов и я) дали интервью изданию Gazeta.ru (оно должно быть согласовано с нами и появится, я думаю, через неделю), где мы изложили свои результаты, сделав особый упор на то, что нерегулярности не должны отождествляться с фальсификациями. Кроме того, рассказывая о наших результатах на крглом столе, Андрей Кунов и Михаил Мягков потратили довольно много времени для того, чтобы сделать упор на этом разграничении.

Дмитрий Шакин

P.S. Вы утверждаете, что понимаете, что мы не отождествляем фальсификации и нерегулярности. Тогда как я должен относиться к вашей фразе "Теперь вот Вы заявили что для Ющенко фальсифицировали голоса, но меньше чем Януковичу." Где это заявлено? В КСШ слово фальсификации вообще употребляется только для передечи мнений других людей, решения Верховного Суда Украины и определении нерегулярностей (как один из возможных случаев неругулярностей).


(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: еще раз простите
[info]federalism@lj
2005-04-24 11:42 (ссылка)
Дмитрий, спасибо за ответ.

Я знаю что Вы хороший математик. Сам я не математик, но был обучен тому что обсуждать можно только статистически значемые результаты. Однако я так и не понял ваш ответ на мой вопрос – какова статистическая значимость конкретной оценки основных (обобщенных) выводов вашей модели – например в МОШ вы оцениваете 14.5 млн голосов за Путина как нерегулярные – но не приводите никакой статистики для этой оценки (например доверительный интервал). По крайне мере этого нет в моей копии статьи. Возможно ревьюеры уже попросили вас ставить статистику в заключительный вариант, тогда я просто не информирован. Так и какова же значимость этой цифры? И других обобщенных цифр.

PS Здорово что вы решили быть особенно акуратными с интерпретацией результатов. Но между прочим, доступная мне копия вашей работы in Post-Soviet Affairs (МОШ 2005) включает абстракт заявляющий что 'Our secondary objective is to measure the extend of electoral fraud, and here we conclude that Putin's success at avoiding a second round vote against his communist challenger in 2004 was aided and abetted by upwards of 14.5 million falsified ballots and that between 1.5 and 3.5 million suspicious votes account for Yanukovich’s ill-fated November “victory”.” Вы с этой фразой из абстракта согласны?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re:
(Анонимно)
2005-04-24 14:41 (ссылка)
Сообщаю: для 114% голосов от ЕдРа к Путину доверительный интервал (95%) равен 108%-120%, для 24% для неголосовавших, перешедших к Путину такой же интервал равен 21%-27%. Можете перевести это дело в миллионы, используя числа из статьи, и убедиться, что доверительный интервал не захватывает 0 (случай отсутствия нерегулярностей). Если подойти к делу более грамотно и рассмотреть односторонний доверительный интервал которого у меня в данный момент нет под рукой), то эффект будут еще более впечатляющим.

Вообще, мне малопонятно ваше болезненное желание ("Была какая-то особая причина не собщать статистическую значимось ваших оценок?") найти какую-нибудь методологическую неточность, пропущенное слово и т.п. Должен вам прямо сказать, что вы не там ищете -- вряд ли вы сможете уличить нас в каких-либо статистических махинациях (хотя вам, я вижу, очень хочется). Я же вам сказал в предыдущем посте, что мы рассуждаем _только_ о _значимых_ нерегулярностях. В ответ на это вы у меня опять спрашиваете (в другой форме): а являются ли ваши результаты статистически значимыми (типа я из вашего ответа этого так и не понял)? Вам моего заверения мало? Может вам просто любопытно? В этом случае, подождите финальной версии.

Дмитрий Шакин

P.S. Ревьюеры говорите? Так их же вроде не было? Или вы "просто не информированы"? По поводу вашего PS - обратитесь к Питеру (на правах его большого друга и советчика) или Михаилу (вы ему очень нравитесь), которые писали английский текст. Я готов вам ответить (как писавший текст КСШ всесте с Андреем Куновым и Алексеем Ситниковым) по поводу любых терминологических замечаний в тексте КСШ. Правда скажу, что сделаю этого без особого желания -- ваш интерес к этой дискуссии заключается в попытках хоть как-нибудь обосновать свое первое высказывание "все это бред", а вовсе не в _конструктивном_ разговоре о методах.

Дмитрий Шакин

(Ответить) (Уровень выше) (Ветвь дискуссии)

методология анализа
[info]federalism@lj
2005-04-24 17:41 (ссылка)
Дмитрий, честное слово у меня нет никакого желания поливать вашу работу грязью. Просто я не согласен с вашей методологией, считаю ее неадекватной. Как я уже признавался я не математик, но я был обучен методологии анализа данных, включая экологический анализ. Дело в том, что обычно (и я могу процетировать вам десяток работ), когда исследователь использует экологический анализ и обнаруживает что анализ перехода дает странный, «невозможный» результат, то делается вывод что используемый МЕТОД НЕАДЕКВАТЕН. В самом деле, невозможно получить коэффицент перехода 1.14 – этот коэффицент должен быть между 0 и 1. Как Вы сами пишите такая ситуация невозможна – ведь один избиратель не может принести больше чем один голос. Однако, мы же на конкретных избирателей смотрим, а на агрегированные данные об избирателях. Все зависит от того как мы агрегируем. Существуют множественные примеры попыток экологического анализа где были получены именно такие «невозможные» оценки перехода (например, как вы уже замечали, исследуя как голосуют черные избератели). Во всех этих случаях был сделан вывод, что был использован неправильный метод. Теоретически, причина «странностей» перехода в неправильном агрегировании – в ошибочном объединении сильно различающихся кластеров – групп с разным распределением. Так сказать классические яблоки и апельсины. Получение невозможные результата до сих пор стимулировало поиск новых метода оценки перехода и нового способа агрегирования, что делает анализ более аккуратным, и позволяет в итоге получить «нормальный» результат. Более того за последние десять лет были разработаны и стали общепризнаными стали методы экологического анализа, просто по самому построению гарантирующие, что результат перехода всегда между 0 и 1. Множество таких методов можно найти в недавней публикации Ecological Inference (2004), CUP. Проблема, как Вы знаете, что эти методы очень трудоемки, требуют множества расчетов, написания специальных программ и т.п. Я бы был готов понять, почему вы решили их не использовать, если бы ваш, более простой метод работал адекватно. Ирония ситуации заключается в том, что ваша группа, решила использовала более простой (устаревший) метод экологического анализ и на этом основании сделала вывод не о том что метод неадекватен, а что предмет анализа подозрителен!

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: методология анализа
(Анонимно)
2005-04-25 02:31 (ссылка)
Я отвечаю на вашы посты в последний раз, так как в ваших словах -- чем
дальше, тем более странные вещи приходтся слышать. Вы, я посмотрю,
считаете себяи знатоком Ecological Inference? Так я вам отвечу. Метод
который мы используем, является новым (если нет -- буду рад, если вы
приведете мне работу, в которой он уже был употреблен). Он является
обобщением недавнего метода Chambers and Steel (2001). Это вы
называете старым методом? Мы использовали и другие методы (как вы их почтительно назвали более трудоемкие), которые гарантируют попадание коэффициентов в отрезок [0,1]. Например, мы взяли метод Г.Кинга (он вам, как знатоку EI должен быть хорошо известен). Да он загнал все коэффициенты куда нужно, но при этом получилось [мы его применяли для перетока между парламентскими выборами -- в нашей предыдущей работе], что Единая Россия получила почти в 3 раза больше голосов, чем у нее было в действительности. В частности, Она получила 68% голосов Единства-99, 66% голосов Отечества-99, 63% КПРФ-99, 91% голосов ЛДПР-99, 89% СПС-99, 93% Яблока-99, 31% неголосовавших-99, 90% других партий-99. В сумме - 57% от общего числа избирателей (реально она получила 21% от общего числа избирателей). В отличие от Г.Кинга, наш метод дал для этого перетока адекватный результат, очень близкий к соц.опросам. Какой из этих методов мы должны в итоге использовать?

Что касается вашего поста про рапределения, то это вообще перл. "Но, на мой вгляд из графиков видно, что второй горб статистически незначим – статистически все распределения выглядят как обычные нормальные распределения." Вот это -- действительно бред. В отличие от вас я [в последний раз] объясню, почему это бред. Как вы можете, сами признавшись, что не знаете какой метод мы используем, не видя наших данных, утверждать на основе визуального(!) анализа, что наш результат статистически(!) незначим. Я не знаю, где вы обучались статистике, но уверен, что если вы покажете этот пост своему бывшему преподавателю, он пересмотрит вашу оценку по этому предмету (хотя, возможно, у вас и так была двойка).

Что в итоге я получил из дискуссии с вами? Вы неуклюже ущипнули метод ПДИ, безосновательно обрушились на статистическую значимость всех методов, упрекнули нас в использовании устаревших методов EI (возможно, я что-то пропустил). При этом ни одно из ваших замечаний не оказалось в итоге по существу, а лишь выявило (1) ваше невнимательное прочтение работы и (2) вашу низкую квалификацию в рассматриваемых рассматриваемых областях статистики. В связи с этим, это мое сообщение будeт последним моим ответом на ваши реплики.

Без всякого уважения,
Дмитрий Шакин

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: метод Фоменко
[info]federalism@lj
2005-04-25 11:26 (ссылка)
Дмитрий, это не моя обязаность выуживать у вас по капле информацию о статистической значимости оценок. И я не должен верить вам на слово. Это ваша обязаность привести результаты всех статистических тестов в своей работе. Более того, даже сейчас вы пытаетесь не отвечать на самые простые вопросы – какой тест вы использовали и как строили гистограмму распределения. Это странная реакция. Ваши заявления о том что все значимо и в будущем все будет сообщенно только усиливают мои подозрения - «Все таблицы перетоков (каждый коэффициент) будут сопровождены доверительными интервалами. Сейчас они там не приведены, но при этом весь разговор ведется только о _статистически значимых_ нерегулярностях (по-другому и быть не может)». А почему же вы до сих пор этого не сделали? Что вам мешало поставить звездочку * напротив значимого коэффицента ? Простите, но это странно. На ВМК это называли - «метод Фоменко». Более того, порывшись в вашей статье я нахожу, что в одном месте вы используете 5 проц критерий значимости, а в другом 10 проц, хотя это мягко скажем, нетрадиционный критерий, но просто потому что у вас «данных мало». Так не делают научные работы. Поэтому-то я заявлял, что версия статьи которую я читал, не являлась научной работой, и не один ревьюер такую работу бы не пропустил. Это публицистика ссылающаяся на авторитет авторов. Минимальные требования предъявляемые к научным статьям требуют точности представления данных и воспроизводимости анализа. Ваша статья (русская и аглийская версия ) пока такой информации не содержит, что означает что анализа нет, а есть только ваше честное слово, что все было сделано правильно. Я надеюсь, что ревьюеры такого уважаемого издания как Post-Soviet Affairs в самом деле потребовали от вас включить информацию о статистической значимости ваших оценок в версию статьи принятой к публикации (здесь я иронизирую). Пока же я процитирую русскую ее вариант - цитирую апендикс – “к сожаленью, асимтотическое распределение найти довольно сложно. Поэтому для тестирования гипотез приходится пользоваться другими методами. Например, возможно использовать бустрапоский подход ... хотя этот метод не слишком эффективен так как статистика непивотальна). конец абзаца“ Из этого «например» и “не слишком эффективен» невозможно понять что же вы делаете. Конкретно, какой подход вы использовали для статьи в Post-Soviet Affairs? Там сказано только, что метод развит в других работах группы: «Because, the formal details of this methodology are presented in Myagkov and Shakin (2005) and Myagkov, Ordeshook and Smirnov (2005) we proceed directly to our estimates...». Однако эти работы в свою очередь по существу анализа мало что добавляют. Возможно, тут возникла некоторая путаница с цитированием, но в любом случае из приведенного куска in Post-Soviet Affairs следует что метод уже доступен для читателей. Подскажите правильную ссылку на работу, где бы я мог ознакомиться с деталями вашей статистической модели и описанием того как вы оцениваете значимость параметров? Три месяца назад я спрашивал об этом у Ордешука, но он сослался на вашу группу – дескать, эта часть анализа данных была проделана в Москве.

(Ответить) (Уровень выше)

Re: еще раз простите
[info]bbb@lj
2005-04-24 12:09 (ссылка)
Дмитрий, в своем постскриптуме вы не правы. Ваш текст создает у читателя совершенно однозначное впечатление, что в третьем туре имела место фальсификация в пользу Ющенко.

Вот, смотрите, параграф 4.2:

Однако, мы хотим не только подтвердить широко известные факты нерегулярностей в этих частях Украины, но и убедится в честности победы Ющенко в третьем туре.

Ниже мы посмотрим, убедились вы в этом или нет.

Весьма просто найти причины, зачем сторонникам Ющенко мог понадобиться этот дополнительный "горб".

Эта фраза, с учетом слова "понадобиться", может читаться только как рассуждение на тему "зачем ющенковцы устроили фальсификацию"

Предположим (на секунду), что выборы были действительно честными. Если мы наблюдаем рост явки между первым и третьим турами в западных регионах, где сконцетрированы избирателиЮщенко, то это означает, что его сторонники стали активнее голосовать. Аналогичный вывод о сторонниках Януковича можно сделать рассмотрев восточные регионы. Как же в этом случае выходит, что в тех районах, где население примерно поровну разделилось между кандидатами, произошло снижение явки? Единственный вывод, который напрашивается из этого рассуждения заключается в том, что либо на западе, либо на востоке (либо и там, и там) избиратели шли на выборы под давлением.

Если бы вы написали "предположим на секунду, что второй тур был честным", то эта фраза, действительно, НЕ обязательно могла бы интерпретироваться как ваше признание фальсификации в третьем туре. В нынешнем же виде она уравнивает второй и третий туры. Читатель НЕ МОЖЕТ НЕ ПОНЯТЬ ее так, что во втором туре имела место фальсификация в пользу Януковича, а в третьем - в пользу Ющенко.

Как видно, в Донецкой области Янукович получал в среднем 1,06 голоса в свою поддержку от каждого дополнительно приходящего на участок избирателя, в то время как Ющенко терял 0,06 голоса. Такая ситуация кажется невероятной при честных выборах, ведь один избиратель не может принести более одного голоса. В Львовской области ситуация еще более ярко выражена: каждый дополнительный избиратель приносит 1,33 голоса в копилку Ющенко. Не стоит однако забывать, что базовым условием применимости нашего метода является однородность регионов, потому на рисунках 5 и 6 отдельно показаны городские и сельские районы, которые значительно отличаются друг от друга по явке. Если провести анализ отдельно для сельских и городских комиссий, то результаты по прежнему остаются нерегулярными.

Что это означает? Что во Львовской области было то же, что и в Донецкой. А так как в Донецкой области имело место нечто, что, вашими же словами, кажется невероятной при честных выборах, то вывод из ваших слов однозначен - во Львовской были такие же фальсификации.

И, наконец, ваши выводы:

Украинские выборы прошли в условиях так называемой конкурентной фальсификации. Оба кандидата прибегали к давлению на избирателей, что отражалось в результатах голосования на востоке и западе страны. Во втором туре более успешными были манипуляции лагеря Януковича, которые принесли кандидату от власти почти 2 млн. "дополнительных" голосов, в то время как Виктор Ющенко приобрел лишь 700 тыс. таких избирателей. Однако уже в третьем туре преимущество принадлежало Виктору Ющенко, в лагерь которого пришло 1 млн. 700 тыс. нерегулярных голосов.

Здесь вы прямо объявляете фальсификацию (с малопонятным добавлением "конкурентная") характеристикой украинских выборов вообще, без разделения на туры, а второй и третий туры рассматриваете просто как разные проявления этой фальсификации.

Так что вынужден прямо сказать - для любого читателя, кроме разве что прослушавшего ваши разъяснения, ваш текст вполне однозначно утверждает, что третий тур на Украине сопровождался массовыми фальсификациями.

Наконец, не могу не обратить внимание на то, что "нерегулярность" - это термин новый, неустоявшийся (по крайней мере, в русском языке). НЕ рассматривать его как политически корректный эвфемизм слова "фальсификация" - читателю очень трудно. Если вы не хотели, чтобы такое прочтение имело место - то вынужден вас огорчить, своей цели вы не достигли.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re
(Анонимно)
2005-04-24 14:42 (ссылка)
Что я могу ответить? Я вам перечислю несколько утверждений, которые, на мой взгляд ответят на все эти возражения (я говорю про статью КСШ).

1) Термин "нерегулярности" вводится в самом начале статьи (не считая введения). Там явно указано, что нерегулярности не равны фальсификациям.

2) Далее везде в статье речь идет нерегулярностях (в частности, честные выборы -- выборы без нерегулярностей, нечестные -- с нерегулярностями). Замечу, что даже в обычном русском языке слово "нечестный" не равно "противозаконный". Да, мы считаем нерегулярные выборы нечестными, так как их результаты не соответствуют свободному волеизъявлению граждан в рамках изложенных в статье моделей. Слово фальсификации к результатам наших методов далее в тексте не употребляется [единственное неосторожное употребление -- про "конкурентные фальсификации" -- мы, я полагаю, уберем. Если вы приведете еще такие неаккуратные высказывания -- я буду вам признателен]. Со всеми вашими выводами из цитат работы я полностью согласен, если заменить слово фальсификации на нерегулярности. В частности, во Львовской области, как и в третьем туре наблюдались _нерегулярности_. Во истину так.

3) Однако, мы, как авторы, не можем нести ответсвенность, если, несмотря на явное указание в начале, читатель продолжает отождествлять в своей голове фальсификации и нерегулярности. Несмотря на это, чтобы избежать недоразумений, цитирование этой предварительной версии запрещено без разрешения авторов (см. первую страницу).

Все проблемы с пониманием текста [по моему мнению] связаны с тем, что люди либо не читают наше разъяснение о нерегулярностях, либо читают его невнимательно [извините, уважаемый bbb, если этим высказыванием я вас причислил к одной из этих категорий]. Мы не можем ориентироваться на них при написании и сопровождать каждое употребление слова нерегулярности сноской с фразой "это не всегда фальсификации, см. определение".
Возможно, вы были бы за такие сноски, но, уверен, вы понимаете и мою точку зрения.

Дмитрий Шакин

P.S. В заведении ЖЖ я не вижу смысла, так как надеюсь, что господа типа federalism'a не будут очень активно лить грязь на наши исследования в будущем.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Re
[info]bbb@lj
2005-04-24 18:58 (ссылка)
Дмитрий, вы же понимаете, что ваша статья - не просто академическое исследование, которое будут читать исключительно профессиональные политологи. Если бы вы писали сравнительное исследование о выборах в Таиланде и Фиджи, это было бы другое дело, но в данном случае речь идет о крайне политизированной тематике, об обжигающе горячей теме. Соответственно, исходить надо не из птичьего языка специалистов, а из общепонятного, общепринятого. Тем более следует стараться избегать введения новых терминов, особенно несущих вполне понятную конотацию. Наконец, вы в своем комменте прямо объявляете, что считаете "нерегулярность" - "нечестной", не отражающей свободное волеизъявление и т.д. Усмотреть тнокую граница между нечестностью и нарушением свободы волеизъявления, с одной стороны, - и фальсификацией с другой - не так-то просто.

В академической среде, если ваш оппонент недостаточно внимательно прочитал ваш текст и проглядел какие-то тонкости - это проблемы оппонента. В публицистике - это проблемы ваши, авторов. Политическая жизнь - это не мой ЖЖ, у вас там не будет возможности объяснить двадцать раз, что вас, мол, недостаточно внимательно читали и неправильно поняли. Журналисты, публицисты, политики - не ищут первоисточники. В их мире статья в НГ - достаточное основание, чтобы прямо говорить о фальсификациях и т.д.

В свое время я тоже приглядывался к результатам украинских выборов (см. http://www.livejournal.com/users/bbb/1119159.html и линки в постинге), и мое ощущение, что анализ ОТНОСИТЕЛЬНЫХ цифр дает в данном случае результаты не просто менее убедительные, чем анализ цифр АБСОЛЮТНЫХ, но в определенных случаях прямо-таки misleading (см. мою дискуссию с юзером hina_chlek).

Кстати, вы можете ко мне обращаться по-простому, по имени, как все другие люди. Оно не секретное :)

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Re
(Анонимно)
2005-04-25 02:54 (ссылка)
Борис, кажется я понял в чем проблема. Вы считаете наш долкад публицистикой. Мы же его считаем _академическим_ исследованием (federalism с этим несогласен, но ни одного разумного довода я от него не услышал). Это подчеркнуто как в подзаголовке ("Аналитический доклад"), так и во всех моих постах. Этот доклад -- предварительная версия будущей академической публикации. По русски мы ее собираемся отдать в серию препринтов Высшей школы экономики, а ее перевод на английский -- в академический журнал. Что касается терминов, то предложите конструктивное решение следующей ситуации. Мы пишем статью о некотором феномене (нерегулярности). Так как этот феномен не имеет устоявшегося термина в русском языке, то мы честно его определили в самом начале, честно предупредив, что с фальсификациями его путать не следует. Ваши предложения?

В чем я с вами совершенно согласен, так это в том, что в журнале "Эксперт" ее в нынешнем виде публиковать не стоит :) -- мы и не собираемся, как не собирались это делать в НГ.

Дмитрий Шакин

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Re
[info]bbb@lj
2005-04-25 11:07 (ссылка)
Проблема не в том, что я считаю ваш доклад публицистикой, а вы его таковым не считаете.

Проблема в том, что он УЖЕ СТАЛ элементом публицистики и не мог не стать, и вы, положа руку на сердце, не могли не понимать, что он станет таковым. Берясь за такую тему, вы не могли ожидать, что обсуждение вашего доклада ограничится узким кругом профессионалов.

Мое предложение было бы - сделать такие разъяснения (насчет того, что нерегулярность не есть фальсификация) более отчетливыми и развернутыми, выделить их шрифтом, повторить в предисловии и заключении. Это во-первых. Во-вторых, мое предложение - еще раз присмотреться к приведенным мной цитатам, из которых, повторю, для читателя практически однозначно следует вывод, что вы таки отождествляете нерегулярность с чем-то очень подозрительным, short of falsification.

Я могу пояснить, в чем я вижу здесь проблему. Дело в том, что в факте систематических фальсификаций в обсуждаемых выборах я практически не сомневаюсь. Но отождествление ваших "нерегулярностей" с фальсификацией позволяет дискредитировать само предположение о наличии фальсификаций, увести обсуждение в ложном направлении.

(Ответить) (Уровень выше) (Ветвь дискуссии)

хорошая новость - плоды междисциплинарного обсуждени
[info]federalism@lj
2005-04-26 18:42 (ссылка)
Борис (и Дмитрий), У меня хорошая новость – теперь мы можем, опираясь чисто на статистику, объянить два из трех типов нерегулярностей полученных в анализе. Остались гистаграммы явки (бампы), но об этом ниже. Правда, объяснения не мои, а двух профессионалов - прикладного математика и экономентрика. Олег Бондаренко (авторы с ним знакомы, для остальных - он прикладной математик и финансист, сейчас учит в Washington University Business School) объяснил мне происхождение зависимостей между голосом за кандидата (в общей явке) и явкой, полученных на графиках. Как показал Олег (выкладки я позднее перепечатаю), это чистый артифакт неправильного проведения регрессионного анализа, ведущий к нарушению предпосылок OLS. Более того, он тут же определил параметры явка и голоса при которых этот "странность" будет проявлятся больше всего. Осталось в Матлабе сгенерировать случайные цифры по явке и голосу, в заданном диапазоне, и получить точно такие же графики (Олег сказал что у него это займет пять минут, но до выходных он занят). Коротко, эффект возникает из-за того, что явка и на правой, и на левой стороне регрессионного уровнения (графики всего лишь иллюстрации регрессии). Между прочим, читая статью, а затем ее обсуждая со мной, Олег постоянно повторял – какой же бред!! и много раз спрашивал как такой бред могли пропустить ревьюеры. Я отвечал что в советологии свои правила. .
Во вторых, сегодня я узнал, почему иногда метод Кинга не работает – как, по мнению Дмитрия, в случае российских выборов в 2003. Оказывается, это известная проблема излишнего агрегирования при использовании метода Кинга – я узнал это от нашего эконометрика, за ланчем (думаю, что ему можно доверять – он пишет с Кингом, да и факультет, благодаря ему входит в десятку сильнейших в стране по методологии, согластно последнему рейтингу US World Report). Для анализа перехода нельзя использовать гетерогенные данные. Для того чтобы метод Кинга работал, надо разбить данные на несколько более гомогенных групп. Например, для России, на федеральные огруга, а еще лучше на группы, сравнимые с Литвой. И считать отдельно по группам. Правильно примененный, метод Кинга гарантирует что странности замеченные при анализе перехода, исчезнут. Таким образом, и вторая нерегулярность снимается.
Что касается графиков распределения (горбов), то здесь мы пока не можем воспроизвести результаты. Похоже все-таки, что графики распределия за Януковича во втором раунде и Ющенко в третьем статистически одномодальны, что bumps о которых вы говорите всего лишь зрительная иллюзия и, статистически не значимы. Более того, пока попытка воспроизвести графики в STATA для Украины никаких бампов не показала. Олег сказал мне, что скорее всего было использованно конкретное сглаживание, очень чуствительное к выбору параметров (бинов). Пока, не зная эти параметры, и детали используемых данных, я получаю совершенно нормальные графики, без всяких бампов.

(Ответить) (Уровень выше)

Re: еще раз простите
[info]bbb@lj
2005-04-24 12:10 (ссылка)
Кстати, если уж вы участвуете в обсуждении, то советую завести аккаунт в ЖЖ. Никаких обязательств это на вас не накладывает, но добавит удобств. В частности, вы сможете получать комменты по почте, а ваши записи будут однозначно идентифицироваться.

(Ответить) (Уровень выше)

Re: еще один вопрос
[info]federalism@lj
2005-04-24 15:00 (ссылка)
Дмитрий, я не совсем понял Ваш ответ. С одной стороны Вы пишите: Я вообще на понимаю (как математик), как можно что-либо утверждать о статистически незначимых результатах. С другой стороны, значительная часть вашей работы строится на анализе друх-горбности распределения явки. Но, на мой вгляд из графиков видно, что второй горб статистически незначим – статистически все распределения выглядят как обычные нормальные распределения. Как Вы знаете существуют статистические тесты нормальности и двух-горбости распределения. Вы проводили такие тесты на нормальность и двух-модальность. Какие тесты? И как вообще построенны графики распределения – как вы знаете картинка очень чуствительна к параметрам – а я бы хотел поиграть с этими графиками на своем компьютере и сравнить с распределением для других стран – Англии, США, Франции, Германии, но не могу это сделать не зная как вы строили ваши графики.

(Ответить) (Уровень выше)

Re: страно что не ссылаются
(Анонимно)
2005-04-21 04:51 (ссылка)
Дополнение

Расхождения в оценках маштабов нерегулярностей: расхождение в цифрах по Украине в МОШ и КСШ обусловлено тем, что в МОШ использовались данные с так называемым приблизительным количеством избирателей (это официальный термин с сайта украинской ЦИК), а в КСШ -- точные данные восстановленные по данным УИК . Расхождение по России обусловлено тем, что в КСШ дана очень консервативная оценка по результату перетока 114% голосов Единой России к Путину (число 3.2 млн. есть и в МОШ). Кроме того, в МОШ к этому добавлены еще голоса дополнительно пришедших (11.5 млн.). Эти голоса прибавлены на том основании, что из анализа распределений следует, что явка падала в нормальных регионах, и росла -- в подозрительных.

Дмитрий Шакин

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: страно что не ссылаются
[info]federalism@lj
2005-04-23 03:19 (ссылка)
Дмитрий, можно Вас спросить - Вы согласны с тем как изложено содержание вашего доклада в НГ - "Фальсификации, утверждают авторы доклада, – проявляются в виде так называемых нерегулярностей – то есть отклонений от общих статистических и математических закономерностей. ...Новая методика позволяет систематически оценить степень и характер фальсификаций."

(Ответить) (Уровень выше) (Ветвь дискуссии)

В догонку ...
[info]federalism@lj
2005-04-23 05:44 (ссылка)
Есть еще один очень важный вопрос. Обычно, результаты статистического анализа сообщаются с данными о его точности. Например, можно оценить доверительные интервалы оцененных параметров. Оценки ожидаются быть статистически значимыми иначе гипотеза отвергается. В этом плане ваш анализ существенно отличается – в ваших статьях нет никакой информации о статистической значимости оценки вашей гипотезы. Например ваши статьи оценивают переток голосов Единой России к Путину в 3.4 млн, но не сообщают точность этой оценки (доверительные интервалы и т.д.). А ведь, как Вы знаете, статистически, оценка в 3.4 млн может незначемой, т.е. быть статистически неразлечимой от нуля. Другими словами - хотелось бы знать – у вас это 3.4. млн голосов плюс минус сколько и с какой вероятностью? Была какая-то особая причина не собщать статистическую значимось ваших оценок?

(Ответить) (Уровень выше)