Настроение: | tired |
Музыка: | Delerium - archives vol. 2 |
swish-search
Дня два занимался тем, что скачивал себе
разные программы поиска по сайту,
компилировал и пытался запустить.
Искалки оказывались слабы, либо принудительно
конвертировали русские буквы в aoue путем
отрезания умляутов, либо требовали MySQL,
для которого нужен root.
Гонорабельного упоминания заслуживает Htdig,
который и откомпилировался и запустился, но при
попытке отиндексировать сайт на 200 мег сдох /bin/sort.
Кроме того, ему требуется 15 часов, чтобы
проиндексировать 200 мегабайт.
После долгих мучений нашел одну программу,
которая работает как надо, т.е. быстро
и без изысков в области морфологии
и нечеткого поиска - swish.
Рекомендую. Интерфейс у нее как у Альтависты.
Конечно, и тут не без проблем с русским;
в скрипте, обрабатывающем запрос, нужно написать
use locale;
use POSIX qw(setlocale);
setlocale(LC_CTYPE, "ru_RU.KOI8-R");
и принудительно конвертировать
запрос в маленькие буквы
my $query_lower = lc($query);
иначе по запросу "Сорокин"
она ничего не находит, а
"сорокин" находит.
Возможно, я неправильно
компилировал swish.
Такие дела
Миша.