Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет flashr ([info]flashr)
@ 2007-10-21 08:00:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Настроение: sleepy

Морфологический анализатор. YandexUtility 0.3
Добавил в секцию "МоиСлова" морфологический анализатор, тот, что сейчас работает на Mail.ru и содержит 161тыс. слов. Лицензия до конца года.
Что он позволяет? С помощью него счетчик слов вашего блога в секции "МоиСлова" начинает воспринимать слова "Человеку" и "Человека", как употребление одного и того же слова "Человек".
Так же включен анализ английских слов тоже, но это мелочи.


Важно: ввиду того, что прога требует много махинаций с файлами, в частности регистрация компонент ActiveX, я добавил установщик. Качаете архив с программой отсюда(9метров). Архив содержит всего 1 файл, который вам все и настроит, просто запустите его и укажите папку куда поставить программу и жмите "Next". Также можете отказаться от перезагрузки компьютера в конце установки.
И самое главное: Не меняйте папку, куда будут установлены словари морфологии - она должна остаться "c:\Rml\", в противном случае анализатор английского работать не будет.(это фича такая)

PS: Для начала мне надо чтобы хоть кто-нить убедился, что это работает не только на моем компе. А то может я что не так сделал...

Вот результат морфологического анализа для моего блога, возможно, потестировав прогу у Вас появятся еще идеи, что можно сделать на базе анализатора. Только учтите, я реализую только те идеи, которые дают качественный результат, а не случайный показатель, которому все потом будут радоваться.

Top30 самых используемых слов в ленте http://flashr.livejournal.com/data/rss

Я:222 ЧТО:190 LIVEJOURNAL:144 COM:141 БЫТЬ:116 КОТОРЫЙ:105 ВЫ:74 ВСЕ:73 ОНО:66 МЫ:56 КТО:54 ОНИ:52 ОДИН:46 MAIL:42 СВОЙ:38 ОН:38 ОНА:38 ТОТ:37 ВЕСЬ:34 ТАКОЙ:32 ЭТОТ:32 ЭТО:30 МОЙ:28 BLOG:28 МОЧЬ:26 МНОГО:24 USER:24 WWW:23 ДРУГОЙ:23 НАШ:23

Всего обработано 120 постов, найдено 6172 слов из них уникально 2263
Длина поста(слов): 2(Минимальная),1245(Максимальная),117.45(Средняя)
(c) [info]flashr@lj и его программа YandexUtility





PS: От себя добавлю, что анализотор работает неудовлетворительно и не воспринимает наш падонкафский сленг.

PSPS: После долгих экспериментов Яндекс меня забанил за слишком большое число запросов за день. Но ничего страшного, Яндекс банит всего на 1 день. Надо попросить у них неограниченное число запросов в день, я ведь их рекламирую или нет?!


(Читать комментарии) - (Добавить комментарий)


[info]ex_flashr@lj
2007-10-21 08:08 (ссылка)
Какой оператор?
Думаю, окупаться не будет, ибо оптимизаторы работаю на клиентов, а клиенты только и знают о расрученном Бренде "Яндекс" и ничего более.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]petersummertime@lj
2007-10-23 15:19 (ссылка)
Я про это говорил: http://roem.ru/2007/10/23/seomarket/

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ex_flashr@lj
2007-10-23 17:49 (ссылка)
ясно. продажа списков обратных ссылок намечается. Но у меня к этому душа не лежит увы. все это мне напоминает спекулянтов товарами.

(Ответить) (Уровень выше)


(Читать комментарии) -