Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет deadbeef ([info]deadbeef)
@ 2004-12-29 00:20:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Как бы это сказать-то...
В общем, написал я давеча софтинку забавную.
А совсем недавно имел общение с [info]pioneer_lj@lj. Странное такое. Сильно [info]pioneer_lj@lj за какого-то Галковского держался. Дескать позарез нужно ему, Пионеру, с оным Галковским разобраться. А после того, как я недоумённо поинтересовался, чем вызван интерес к какому-то дерьмовому писателю, Пионер изменился лицом и вскоре, при случае послал меня нахуй по совершенно пустяцкому поводу.
Почесав репу на предмет таких чудес, я предположил, что как-то Пионер с Галковским связан. И тут вспомнил про софтинку.
Эксперимент - основа научных знаний.
Нарыл в инете так и не прочитанный "Бесконечный тупик" (не для того, чтобы читать, естественно) и надёргал из ЖЖ Пионера за 2002-й / начало 2003-го килобайт эдак 200 чисто его, Пионера, текста, без цитат там всяких и пр.


участок спектра текста с 100-го по 200-е буквосочетания для Галковского и Пионера:
Image

Ну, конечно, не 2 куска Лукъяненко, как тут, но в то же время и не очень-то отличается...
Если счесть результат эксперимента положительным, то всё становится на свои места.
Но каков песдец тогда получается! Тьфу.

ЗЫ:А софтинка - да, дерьмовенькая софтинка... Но уж какая есть. Других-то, получше, и не видать что-то.



(Добавить комментарий)


[info]noleg@lj
2004-12-28 22:02 (ссылка)
Идея понятна. Ты результат для чайников выдай :-)
А заварушка и правда была какая-то странноватая.. Да я и сам Пионера читать тогда перестал.
Зато сейчас он опять в ударе.

(Ответить) (Ветвь дискуссии)


[info]vchk@lj
2004-12-28 22:10 (ссылка)
Дык картинка же.... Куда ещё чайниковее?
Спектры текстов Пионера и Галковского практически совпадают. Как будто их писал один человек.

ЗЫ: Картинку видишь? Если нет - поставь FireFox или Оперу.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Вопрос об анонимности браузера Opera v7 и v8
(Анонимно)
2004-12-29 17:34 (ссылка)
На странице http://www.livejournal.com/pubkey.bml?user=vchk открытий ключ GnuPG vchk есть, а адреса электронной почты - нет.

Уважаемый vchk, можно Вам по электронной почте задать конкретный вопрос вопрос по норвежскому браузеру Opera 7-8?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Вопрос об анонимности браузера Opera v7 и v8
[info]vchk@lj
2004-12-29 17:49 (ссылка)
Дык адрес электронной почты внутри ключа есть :)

gpg --import vchk.key

И адрес сразу же найдётся.

А насчёт Оперы - это я вряд-ли чем помочь смогу. Не использую я Оперу совсем...

(Ответить) (Уровень выше)

Польза от посыла нахуй
[info]object@lj
2004-12-28 22:06 (ссылка)
А не послал бы вас на хуй Пионер, не сделали бы вы этого Великого Открытия. Вот ведь как порой выходит.

(Ответить) (Ветвь дискуссии)

Re: Польза от посыла нахуй
[info]vchk@lj
2004-12-28 22:15 (ссылка)
А чего не анонимно-то? :) Забыли? Или это я что-то путаю? :)

Как раз посыл нахуй меня не тронул совсем.
Меня другое удивило и заставило попристальнее поглядеть на всю эту херню произошедшую за последнее время. Её полная иррациональность.
Подробно изложено вот тут: http://www.livejournal.com/users/vchk/55667.html

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Польза от посыла нахуй
[info]object@lj
2004-12-28 22:36 (ссылка)
Вы что-то путаете. Я не пишу анонимно.

Но Пионер, конечно же, не Галковский. Из чего следует одно из двух:

1. Что исходную выборку надо перерабатывать.

2. Что сам подход некорректен. Почему буквенные сочетания? Почему не слова или хотя бы корни слов? Да и к тому же есть методы сравнения текстов (в них, насколько я знаю, единицей являются слова). По одной из версий, такими методами пытались вычислять Даниэля с Синявским.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Польза от посыла нахуй
[info]vchk@lj
2004-12-28 22:45 (ссылка)
> Вы что-то путаете. Я не пишу анонимно.
Значит напутал. Извините.

> Но Пионер, конечно же, не Галковский. Из чего следует одно из двух:
Оба этих два, которые следуют из, вполне верны. Методы другие есть, и исходная выборка не фонтан. Подробнее всё написано тут: http://www.livejournal.com/users/vchk/50658.html - что, почему, зачем и как.
Но вот откуда следует что Пионер - не Галковский (ну или наоборот)?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Польза от посыла нахуй
[info]object@lj
2004-12-28 22:47 (ссылка)
Да вроде есть люди, знаюшие их обоих. Впрочем, я не в теме.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Польза от посыла нахуй
[info]vchk@lj
2004-12-28 22:58 (ссылка)
Может и есть. В инете вообще много чего есть.
Но существуют ли они на самом деле?

(Ответить) (Уровень выше)

Имя для софта придумал
[info]brat_karamazov@lj
2004-12-28 22:36 (ссылка)
Мурзилкометр.

(Ответить) (Ветвь дискуссии)

Re: Имя для софта придумал
[info]vchk@lj
2004-12-29 11:08 (ссылка)
А причём тут детский журнал? В ЖЖ вроде не совсем дети пишут...
Скорей уж клонометр или куклометр.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]cousin_it@lj
2004-12-29 14:16 (ссылка)
"Мурзилка" в лексиконе Галковского синонимично "виртуалу" или просто оболваненному человеку, иначе говоря - магнитофону.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vchk@lj
2004-12-29 14:23 (ссылка)
А кто такой Галковский, чтобы его лексикон кто-то стал использовать, да ещё при наличии нескольких устоявшихся терминов?
Вот "клон" - знаю, "кукла" - знаю, "виртуал" - знаю. Зачем нужны ещё какие-то термины?

А "Мурзилка" - это просто детский журнал.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]cousin_it@lj
2004-12-29 17:23 (ссылка)
Вы правы.

(Ответить) (Уровень выше)


[info]lidums@lj
2004-12-28 22:44 (ссылка)
Хм. А не получится ли так, что Галковский времен ЛЖ на "Бесконечный тупик" похож меньше, чем Пионер?

(Ответить) (Ветвь дискуссии)


[info]vchk@lj
2004-12-28 22:56 (ссылка)
Не знаю, не проверял.
Софт выложен, всё доступно, кто-то даже online-спектрометр написал: вот.

Если получится, так, что "Галковский времен ЛЖ на "Бесконечный тупик" похож меньше, чем Пионер" то будут основания утверждать, что это Пионер написал эту туфту. Во всяком случае Пионер эту муть вполне явно рекламировал: http://www.livejournal.com/users/pioneer_lj/359.html?thread=9575#t9575

Бред? Ну да, выглядит бредово. Но ничуть не менее бредово чем та история, с которой всё началось.

Блин, маразм, какой-то. Виртуалы, софт, возня в инете, ёбля мозгов друг-другу и т.п... Это вот для этого вот инет придумали??? Заебало.
Пора занятся уничтожением этой сраной иллюзорной реальности.

(Ответить) (Уровень выше) (Ветвь дискуссии)


(Анонимно)
2004-12-29 03:18 (ссылка)
"Виртуалы, софт, возня в инете, ёбля мозгов друг-другу и т.п... Это вот для этого вот инет придумали??? Заебало.
Пора занятbся уничтожением этой сраной иллюзорной реальности."

Stopudovo! Но какой интересный способ пропиарить "Пионера", "Галковского" и кого там ещё. Многие Хорошие Ребята (программисты то есть) триссссссссссссссссссста лет жили бы и не знали, кто такие эти публи ...э... цисты. А теперь - узнАют. Авось кто-то и увлечётся их твохчеством.

Что касается "русского лома", то его пример - не столько пост с исходником, сколько тред. Человек выложил код на блюдечке, объяснил, расписал всё как есть. Заодно продемонстрировал интересную недоработку IE. Ни одна (ni odna!) зараза не поблагодарила. Зато нашлись такие, которые автора же и оплевали - почему блюдечко, блин, без каёмочки и почему вообще им на ложечке в рот не положили. Вот это "русский лом" и есть. А я, хоть и не нужна лично мне эта штука, хотел написать, мол, спасибо - за открытый код каждому автору полагается спасибо, а уж за попытку разоблачить виртуалов и подавно - и добавить несколько рацпредложений. НО я-то как раз и забанен. Надо полагать, за сионизм и жидовское нутро. Ну и ладно.

Общий привет тогда.

[info]amddiffynfa@lj

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vchk@lj
2004-12-29 18:20 (ссылка)
> НО я-то как раз и забанен.

Если честно - не помню за что. Но раз забанил - видимо причина была... Возможно даже, что за работу spellchecker'ом.

> Ни одна (ni odna!) зараза не поблагодарила.

Да мне как-то наплевать. Пригодится какому русскому человеку - замечательно. Нет - да и хер с ним.
А цели получить благодарность, или там ещё чего, у меня не было и нет. :) Это пусть другие благодарностей жаждут...
Мне и без благодарностей нехуёво...

> нашлись такие, которые автора же и оплевали

Это хде? Херота какая-то по обыкновению погадила, да и всё.
Чтобы меня оплевать - нужно для начала что-то более совершенное и продвинутое написать. Потом, выложить на всеобщее обозрение созданное, после чего доказать что в моём поделии содержатся принципиальные ошибки из-за которых результаты поделия вообще ничего не значат. Вот тогда - да. Я пойду умываться.

> добавить несколько рацпредложений.

Рацпредложения совершенно необязательно добавлять путём запощивания комментов.
Можно, например, взять код, переделать, и выложить у себя. Некоторые так и сделали, кстати.

(Ответить) (Уровень выше) (Ветвь дискуссии)


(Анонимно)
2005-01-05 14:59 (ссылка)
Очевидно полное непомнимание статистики и теории НЛП
Например, спектр на уровне буквосочетаний не дает идентификации автора
Гораздо важнее корреляция между буквосочетаниями
И для русского языка гораздо "характеристичнее" спектр на уровне трехбуквенных сочетаний (для английского двух достаточно)
Сразу видно, чем кодер отличается от человека, имеюшего высшее образование и разбирающегося в математике

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vchk@lj
2005-01-06 07:20 (ссылка)
> Например, спектр на уровне буквосочетаний не дает идентификации автора

Где пример?

> Гораздо важнее корреляция между буквосочетаниями

Возможно. Где софтина, примеры, доказывающие это, и всё такое?

> И для русского языка гораздо "характеристичнее" спектр на уровне трехбуквенных сочетаний (для английского двух
> достаточно)

Может быть. Вообще ничто не мешает переделать софтину под трёхбуквенные сочетания.

> Сразу видно, чем кодер отличается от человека, имеюшего высшее образование и разбирающегося в математике

Ну дык. Если бы я не имел высшего образования и не разбирался в математике, то я б и такую софтинку не написал бы, а, например, шарился бы по чужим журналам и подпёздывал бы поливая дерьмецом то, что делают другие. Но высшее образование у меня есть, да и в математике разбираюсь, поэтому у меня есть хотя бы вот такая программка, а у подпёздывающих - нету никакой.

(Ответить) (Уровень выше)


[info]azzztec@lj
2004-12-29 03:59 (ссылка)
Нда уж, забавно. А вот еще персонаж образовался: http://www.livejournal.com/users/00088/ Тож какой-то мучительно знакомый слог :)

(Ответить) (Уровень выше)


[info]metaclass@lj
2004-12-29 06:19 (ссылка)
Форумы, ЖЖ, чаты и другие места для флейма(эхи фидошные) дык точно грохнуть надо. Личную переписку оставить, статьи оставить, остальное к псам. Это как будто каждому дали по личному издательству с нулевыми расходами на бумагу и печать. В гугле любой запрос обязательно выдаст несколько десятков ссылок на форумы, где в лучшем случае хоть кто нибудь на интересующий вопрос ответит, а в худшем - 10 человек зададут его же. Информационный шум, да и время отнимающий.

(Ответить) (Уровень выше)


[info]fireredd@lj
2004-12-29 08:01 (ссылка)
Вы можете высчитать коэффициент корреляции между этими двумя функциями, только вам надо сначало взять два куска из "Бесконечный тупик" и провести ту же процедуру тоесть определеить корреляцию между этими кусками с заведомо одним автором, а уж потом сравнивать пионера с Галковским. Иначе можно сказать, что у Вас просто чистое совпадение абсолютно случайное.

(Ответить) (Ветвь дискуссии)


[info]vchk@lj
2004-12-29 08:11 (ссылка)
Дык считайте, кто мешает-то?

Мне достаточно того, что Пионер совершенно случайно не совпадает ни с одним автором текстов, нашедшихся у меня на винте, зато почти совпадает с Галковским. 2 куска одного автора, даже из разных текстов совпадают всегда. Разные авторы сильно различаются, всегда есть приличное количество явных несоответствий, когда для какого-нибудь буквосочетания у одного - пик, у другого - впадина.

(Ответить) (Уровень выше)


[info]morky@lj
2004-12-29 09:55 (ссылка)
А что такое "участок спектра текста с 100-го по 200-е буквосочетания"? Если это те буквосочетания, которые в словах "интеллигенция", "либералы", "путин" и тому подобных, то совпадение закономерно.

(Ответить) (Ветвь дискуссии)


[info]vchk@lj
2004-12-29 10:09 (ссылка)
О Господи!
Ссылки же даны на абсолютно всю информацию! Так сложно посмотреть, что это за буквосочетания?

"их","оч","вл","ож","ят","хо","эт","пе","тн","ых","ры","уд","чт","ио","ще","ку","аб","дн","сп","ьс",
"ео","ая","чи","ий","му","св","ги","ду","ае","йс","це","нт","ча","ше","оо","лю","сс","ют","вр","яв",
"жн","уп","ез","ус","зв","ым","ыл","мы","кр","ян","ну","ее","па","иа","еб","ую","аи","нс","са","ьк",
"га","иг","ыв","еи","еч","кт","жи","аж","ты","ый","уч","ут","ту","иб","яс","мн","ач","су","чн","яп",
"ыс","зм","бе","дл","зо","ац","сь","пи","мп","лу","дс","ах","ын","бр","ям","ня","ур","щи","гр","яз"

Участок выбран просто на глаз, примерно с 100 по 200, просто потому, что картинка по высоте небольшая получается, но и достаточно информативная.
В начале спектра резкий спад идёт, если сплюснуть картинку - невнятно будет, а в конце - редкоупотребимые и неинтересные буквосочетания (совсем малые величины). Но в целом, по всему спектру картинка одна и та же.

(Ответить) (Уровень выше)

Разгадка
[info]do_@lj
2004-12-29 10:49 (ссылка)
...а фишка-то в чём... фишка-то в том, что во время Оно был Пионер занят перекидыванием какашками с Галковским, и в процессе обнаружил, что лучше всего бить Дмитрий Евгеньича его же оружием, в деталях копируя его стиль. Чего, в общем, как раз и оказалось возможным померить Вашей хитроумной софтинкой..;)

(Ответить) (Ветвь дискуссии)

Re: Разгадка
[info]vchk@lj
2004-12-29 10:59 (ссылка)
Имеем:
1. 2 персонажа занимаются одним и тем же - перекидыванием какашками.
2. Стиль у них субъективно, по Вашим наблюдениям, одинаковый.
3. Софтинка говорит, что тексты этих 2-х персонажей действительно совпадают и по объективному, не зависящему от субъективных впечатлений наблюдателя, параметру.

Если нечто плавает как утка, выглядит как утка и крякает как утка, то почему бы это нечто не считать уткой?

(Ответить) (Уровень выше) (Ветвь дискуссии)

"утка"
[info]som@lj
2005-01-20 14:11 (ссылка)
уважуха, ВЧК !

(Ответить) (Уровень выше)


[info]dr_wolf@lj
2005-01-06 06:18 (ссылка)
Интересно весьма.
Спасибо.

(Ответить)