Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет old_apazhe ([info]old_apazhe)
@ 2004-11-22 12:46:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
А вот интересно, почему среди сторонников "открытых систем" мудаки так часто встречаются?
http://www.livejournal.com/users/vchk/50658.html?thread=569826#t569826

ps: кстати, если кто соберёт это дело под win32 и даст мне — я очень даже обрадуюсь.


(Читать комментарии) - (Добавить комментарий)

Гы-гы-гы!
[info]the_toad@lj
2004-11-22 06:36 (ссылка)
Мда, подсчёт сочетаний из двух символов - это явно мощное направление в экспертизе. И почему эти придурки-лингвисты до сих пор до такого не догадались? ;-)

Среди моих знакомых это называется "программа, сделанная программистом" ;-)))

Опять же напомнило, как одна очень хорошая дама некоторое время считала меня виртуалом correlation чисто потому, что я слово "жопа" использую примерно с той же частотой ;-) Хотя у corellation количество прилагательных на предложение сильно выше, чем у меня, и вообще набор активных прилагательных сильно шире, чем мой базовый комплект "полный\исключительный\необыкновенный\хуёвый\пиздатый" (прилагательные "исключительный\необыкновенный" обычно используются вместе с существительным "мудак", а "полный" - вместе с "пиздец") ;-) И средняя длина предложения у correlation явно поболе.

(Ответить) (Ветвь дискуссии)

Re: Гы-гы-гы!
[info]ex_ex_apazh@lj
2004-11-22 06:45 (ссылка)

(рыдает)

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Гы-гы-гы!
[info]the_toad@lj
2004-11-22 07:39 (ссылка)
Вот, а если серьёзно - так этой проблемой-то занимаются. И не первый год. Кстати, в журнале той же correlation (правда, сильно давно) были блестящие подборки квазисинонимов и квазимеждометий (последнее - это, типа, слова, не несущие существенного смысла. Типа на уровне "типа" и "как бы". У неё там в результатах слова "культура", "культурный", "мораль", "моральный" занимали видное место). Фишка в том, что банальный подсчёт двухбуквенных сочетаний - это ни в пизду, ни в Червонну Армию. Лично я к анализу текстов с позиций "смысла" отродясь отношения не имел, но таки могу сказать, что даже с точки зрения компрессии текста дело давно уже зашло сильно далее банальных двухсимвольных сочетаний. Даже там уже давно норовят навострить алгоритмы, которые довольно длинные паттерны пытаются выявить.

Вот. А в данной программе - вы заметили, например, что там знаков препинания нет? Т.е. частотность знаков препинания никак не рассматривается, соответственно, длина предложения - тоже?

А ещё, опять же, возвращаясь к разнице между мной и correlation - она часто предложения со строчных начинает. Я - никогда. Зато и она, и я никогда не пишем "е" вместо "ё" - а данная программа "ё" вообще игнорирует. Ну и чего ожидать-то от подобной "программы, написанной программистом"?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re[2]: Гы-гы-гы!
[info]ex_ex_apazh@lj
2004-11-22 08:06 (ссылка)

О, интересные вещи рассказываете.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(подозрительно)
[info]the_toad@lj
2004-11-22 08:16 (ссылка)
...издеваетесь, да?! ;-)

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: (подозрительно)
[info]ex_ex_apazh@lj
2004-11-22 08:41 (ссылка)

Нет, мне действительно интересно.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: (подозрительно)
[info]the_toad@lj
2004-11-22 09:20 (ссылка)
Да я какие-то совсем "общие места" рассказываю, да и то крайне сумбурно (и наверняка с ляпами). Но просто мысль о том, что по 512-ти (гм, ШЬРЩ круглые цифры - тоже симптом того, что программа создавалась именно "программистом", а не "экспертом") двухбуквенным сочетаниям так-таки можно и экспертизу провести... ну да, блин, на ком-то он проверил. Ох, бля, и выборки у него были - прям в тыщу авторов и миллион знаков с каждого, а то! Ах, он картинки увидел, ах, ёбтыть! Ах, и картинки оказались разными! Ахуеть! А исчислить эту разницу количественно с ипользованием богатейшего аппарата матстата он пытался? А? Что? Не слышу? Найти барьер по той же количественной разнице, чтобы таки получить возможность достоверно отличить "одного" от "другого", проведя хренову тучу экспериментов - пытался?

ПиздИть-то мы все горазды. Я вот, например, весьма горазд пиздИть, уж кто бы сомневался ;-) Но мне всё-таки хватает ума не выдавать мой пиздёж за конечную истину ;-))) Я свой пиздёж предпочитаю считать чистым образцом жанра ;-)))

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re[2]: (подозрительно)
[info]ex_ex_apazh@lj
2004-11-22 09:28 (ссылка)

За информацию спасибо, да.

(Ответить) (Уровень выше)

Re: (подозрительно)
[info]unrulymind@lj
2004-11-22 21:37 (ссылка)
Ить иж как Вы ловко его на чистую воду-то вывели! Тока беда в том, что данный персонаж свою программку ни за какую "конечную истину" выдать не пытался. А выдавал он ея, як простейший пример частотного анализа. Ну простейший он, пример этот, что уж тут поделать-та? Но общую картиначку, общий принцып, почувствовать таки даёт возможность. Безусловно, анализ этот весьма приблизителен и не даёт ничего, кроме, собственно, частоты употребления в тексте этих самых 512 буквосочетаний. Делать какие-то выводы на основании этого результата... ээ... сложно. Но результат интересен сам по себе. Нет бы расширить тему, да предложить более продвинутый алгоритм, коль скоро тематика общественость заинтересовала, так всё изобличать лезуть.
С кем воюете-та? Лучче б просто расшарили нам данную интересную тему, без всех этих левых наездов, ибо всегда, когда специалист столь яростно защищает свою вотчину от происков неспициялиста, это плохо пахнет.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: (подозрительно)
[info]the_toad@lj
2004-11-23 00:23 (ссылка)
Ну, раз уж нас на экспертизу пробило - так ведь я и не говорил, что он пытается нечто выдать за конечную истину, правда? ;-) Я лишь говорил, что мне хватает ума этого не делать ;-)))

(Ответить) (Уровень выше)

Re: (подозрительно)
[info]ex_dr_estet52@lj
2004-11-23 00:10 (ссылка)
может, напишите формулы и алгоритмы, которые бы были лучше данного двухбуквенного чуда, я бы как-нибудь реализовал это дело

самому читать долго, вот записать в виде кода - другое дело

(Ответить) (Уровень выше)

Re: (подозрительно)
[info]azatiy@lj
2004-11-22 21:03 (ссылка)
Да пошукать по словам "контент-анализ" и "экспертные системы"...

(Ответить) (Уровень выше)

Re: Гы-гы-гы!
[info]drw@lj
2004-11-23 03:25 (ссылка)
Что значит "норовят навострить"? Алгоритм LZW используется уже двадцать лет.

(Ответить) (Уровень выше)

Re: Гы-гы-гы!
[info]ex_jetteim@lj
2004-11-22 19:57 (ссылка)
А сравнение словарей даст более-менее адекватную корреляцию. На текстах, скажем, от полукилобайта?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Гы-гы-гы!
[info]the_toad@lj
2004-11-23 00:36 (ссылка)
Боюсь, тут не всё так просто. Скажем, выбор существительных и глаголов в большей степени обусловлен собственно предметом обсуждения. Грубо говоря, если вы пишете о кошках, вам будет сложно вставлять слово "трактор" в каждое предложение. А если на следующий день вы пишете о тракторах, слово "кошка" в тексте вряд ли будет упоминаться. Так что в этом смысле словари будут различаться. А вот прилагательные и наречия несколько менее "обязательны", там автору больше шансов развернуться...

Вот, а вообще-то за тонкостями - это к терапевту, к терапевту. У него и кабинет больше ;-)

(Ответить) (Уровень выше) (Ветвь дискуссии)

RE: Гы-гы-гы!
[info]ex_jetteim@lj
2004-11-23 00:38 (ссылка)
А учебники по терапии есть?

(Ответить) (Уровень выше)

Кошка? трактор? Как нехуй делать.
[info]probegi@lj
2004-12-02 05:55 (ссылка)
Свернувшись на лежанке, уютно мурлыкала кошка. Ей было так тепло и покойно, а в горнице стояла такая тишина, что Абрам Фемистоклович снова перенесся душой в тот летний полдень - к жаркому стрекоту кузнечиков, истомному небу, отдаленному рокоту трактора...

или

Трактор завелся с пол-рывка. Дизель вчера удалось отрегулировать на диво хорошо - звук его работы напоминал скорее сытое мурлыканье кота, чем голодный рев танка. Кузьмич крякнул и удовлетворенно шмыгнул носом.

Нет, настоящайа летеротура никакой аналитике неподвластна.
хехехе

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Кошка? трактор? Как нехуй делать.
[info]ex_ex_apazh@lj
2004-12-02 06:15 (ссылка)

(истерически) Афтар жжош беспезды!

(Ответить) (Уровень выше)

Пардон
[info]ex_jetteim@lj
2004-11-22 19:58 (ссылка)
корреляцию?

(Ответить) (Уровень выше)


(Читать комментарии) -