Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет kouzdra ([info]kouzdra)
@ 2012-03-05 09:53:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Выборное:
[info]corbulon@lj занимается статистикой и уверяет в магическом смысле цифирки "0".

При этом упускает как минимум одно правило - если есть статистическая аномалия - стоит таки (если вы занимаетесь не пропагандонством, а действительно заинтересованы в честном ответе) поискать альтернативное объяснение - в данном случае оно есть и очень простое:

Все, кто занимались муторными пересчетами, знают, что цифирь имеет свойство не сходиться с контрольной. Если у вас нет морального стимула все делать точно, а есть расхождение на 5-10 единиц, вы уже пару раз пересчитали, время за полночь, и домой хочется - естественное (и на практике часто и применяемое) решение - подогнать цифры так, чтобы сошлось. Грех небольшой - +- несколько копеек.

И вот тут и возникают нолики в последней цифре.

Что, кстати, объясняет и лучшие результаты с коибами - они-то просто выдают некоторую по определению "годную" цифирь. А вот между прочим версия с переписыванием протоколов ее уже не факт что объясняет - переписать-то можно и с коибом.

PS: Я не к тому, что это действительно так - а к тому, что "статистик", который не видит этой версии (она проверяема - но не этим методом) - ...


(Добавить комментарий)


(Анонимно)
2012-03-05 11:27 (ссылка)
Принцип О'Брайена.

Ревизор всегда отвергает счет расходов, если итоговая цифра делится на 5 или на 10.

(Ответить) (Ветвь дискуссии)


[info]kouzdra
2012-03-05 11:29 (ссылка)
Разумеется - потому, кстати, это ничего вообще не доказывает, кроме общего уровня халтуры (который, конечно, будет коррелировать с подтасовками, если они есть)

(Ответить) (Уровень выше)


[info]paver
2012-03-05 17:20 (ссылка)
Да, нелюбофь к девятке можно объяснить округлением. Но тогда и единица должна бы быть ниже ожидаемого, хоть ненамного.

(Ответить) (Ветвь дискуссии)


[info]kouzdra
2012-03-05 17:28 (ссылка)
А 9-ку привычнее округлять "вверх", чем резать единичку (что даже понятно - бо в десятичной дроби за 9-кой идут еще какие-то цифирки, тут этого нет - но рефлекс-то есть).

Но я не об округлениях - а о том, что если надо сальдо с бульдо свести - проще выбирать круглые циферки, а разницу загнать в последнее поле (то есть если сумма одна - пофиг, а вот если есть какие контрольные кросс-тесты - уже да - свести баланс "до копейки" даже в двумерной форме - секс тот еще)

(Ответить) (Уровень выше)


[info]os80.livejournal.com
2012-03-05 23:10 (ссылка)
А кстати - оказывается, можно было продать свой голос на штуку, об отсутствии коей возможности Вы сокрушались. Не совсем легально, правда, да и влом тащиться открепительное получать.

(Ответить) (Ветвь дискуссии)


[info]kouzdra
2012-03-06 12:26 (ссылка)
Там еще кидалово было - а кое-где в общагах грят очередь за "прохорова по 500 рублей" была

(Ответить) (Уровень выше)


[info]lqp
2012-03-06 11:31 (ссылка)
Только сейчас до меня дошло, откуда там, собственно, эта неравномерность. Забавная, кстати, получается задачка на тервер.

(Ответить) (Ветвь дискуссии)


[info]lqp
2012-03-06 11:39 (ссылка)
И очень хитрая манипуляция.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kouzdra
2012-03-06 12:27 (ссылка)
Меряется этим методом халтурность работы комиссии - каковая коррелирует и с возможностью вбросов - потому если вбросы есть - это неплохой критерий. Но наличие вбросов (и тем более их величина) из этого не выводится.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lqp
2012-03-06 13:46 (ссылка)
Смотри. Большинство цифр в избирательной статистике - это некое распределение на множестве целых от 0 (или от M, круглого) до N (общего числа избирателей). Если N - некруглое, то цифры от 0 .. N-[N/10]*10 имеют слегка большую вероятность появиться в результате, чем цифры N-[N/10]*10+1 .. 9. Ненамного, на величину порядка 10/(N-M), то есть на доли процента, но на графике как раз доли процента и нарисованы, если присмотреться внимательно к шкалам. Суммируем эффект по всем целым числам, получаем наклонную кривую (или даже прямую, не проверял). Если N с самого начала распределено неравномерно (например потому, что УИК по закону должен быть <3000 чел, и, естественно, к этому числу будут подгонять вплотную для экономии ресурсов) - эффект усиливается. Разумеется для реальных распределений я количественные оценки на пальцах не посчитаю, зависимость там несколько меньше линейной, но общий принцип надеюсь понятен.

А если бы там была значимая подрисовка, то, скажем, разница между нулем и единицей была бы на порядки больше разницы между единицей и девяткой. Чего не наблюдается. Разница порой больше, но не на порядки и часто даже не в разы. Видна именно наклонная кривая.

Для того чтобы придумать такую "неточность" надо не одну неделю усердно трудиться. Мысленно аплодирую.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lqp
2012-03-06 16:09 (ссылка)
-----
#!/usr/bin/perl -w
use Data::Dumper;
for (1 .. 1000000) {
$bin[ int(rand(int(rand(1000)))) % 10] ++;
};
print Dumper \@bin;
-----
$VAR1 = [
105048,
102714,
101538,
100678,
99973,
99051,
98466,
98511,
97424,
96597
];
---

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kouzdra
2012-03-06 16:13 (ссылка)
Гм. Я эффект полагал где-то на порядок-другой меньше

(Ответить) (Уровень выше)


[info]semonsemenich.livejournal.com
2012-03-07 11:19 (ссылка)
У rand вроде собственная регулярность есть...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kouzdra
2012-03-07 11:21 (ссылка)
Возможно - но результат вполне объясним и без этого предположения - так и должно быть (другое дело, что реальная ситуация все-таки похитрее этой модельки)

(Ответить) (Уровень выше)