Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет krylov ([info]krylov)
@ 2008-05-18 02:44:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
в кои-то веки прошёл Тест

Произведения, наиболее похожие по частоте слов на блог [info]krylov@lj v. 0.11

Анатолий Алексин: Про нашу семью
Сирил Паркинсон: Законы Паркинсона
Джон Ле Карре: Портной из Панамы
Литературный журнал "Самиздат": Шнейдер,Гречишкин. Акынская песня с прологом и эпилогом sep-98
Иосиф Бродский: Интервью Иосифа Бродского
Эрик Амблер: Маска Димитриоса
Дэйв Дункан: 2. Настоящее напряженное
Боевые роботы (BattleTech): Майкл Стакпол. Кровавое наследство
Жерар Клейн: Ад есть ад
Питер Бигль: Песня трактирщика

(c) [info]stanislav_mikov@lj
А какие произведения похожи на ваш блог???


Ну и:



)(


(Читать комментарии) - (Добавить комментарий)


[info]emdrone@lj
2008-05-17 20:38 (ссылка)
Есть простой до удивления алгоритм, который однако дает вполне осмысленные результаты.

В тексте надо определить САМЫЕ ЧАСТЫЕ ДЛИННЫЕ слова. Они дадут поисковые термины, неочевидные, вы бы никогда их так вместе не поставили "из головы", которые, будучи скормленными поисковой машине вроде Гугла, принесут список текстов и по смыслу и стилистически близких.

Вот вам несколько рядов, полученных при разных параметрах отсечения по длине на concatenation примерно 500 кб или 200 записей из вашего дневника:

Самые частые - слева. Посмотрите что Гугл и прочие принесут вам на запрос из пятка-десятка членов этого ряда. В моих пробах выходит довольно правдоподобно и похоже, хотя История сексуальности Мишеля Фуко на второй странице результатов меня несколько насторожила ;))))
    [1] русскими понимаемый известно стороне которые человек всё-таки коммент например значит называем образов кстати которым конечно исторически является правила праведник --/эти покороче; их находится примерно 20-40/

    [2] всё-таки например известно Например является праведник нескольким конечно государствах правителей внимание Холокоста разумеется материала Константин коммента высказывание человека какой-нибудь информацией довольно Аракчеев Александр существовавшей результат расстреливает некоторый некоторые национал-патриотов -- /эти подлиннее; таких находится по 15-30/

    [3] Константин какой-нибудь разумеется государство совершенно собственности ответственности обязательно интеллектуал высказывание удовольствие праведник Интересно зависимости стихотворение национальной Достоевский антисемитизма что-нибудь частности становится соответственно практически праведник относительно какая-нибудь использовать информацию --/еще подлиннее, таких слов по 6-16/

Если в последовательность попадает уникальное, темообразующее слово (вроде "холокоста"), то оно естественно замусорит поиск (или наоборот, даст лучщий результат, как считать ;)) )

Слова общие как бы передают стиль и помогают поиску вытащить "похожие" тексты.
Короче, сделайте пару копи-пейстов и посмотрите, на кого вы действительно похожи ;))

(Ответить)


(Читать комментарии) -