Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2007-11-27 07:51:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Как искать?
Это не ответ, это вопрос. Тратим мы на поиск в сети примерно 40% времени от всей длительности сидения в сети. И видно, что люди, профессионально поиском занимающиеся - умеют это делать ну очень хорошо. И наверняка приемы какие-то отработались... Я не о подборе ключевых слов и не о применяемых модификаторах запроса. Это - общая техника, каждый в меру грамотности ее использует. Я о другом. Вот новая область, - начал искать... На такой-то набор ключевых слов высыпалась неплохая инфа, надо просмотреть хоть страниц 5 поисковика, на второй странице пришло в голову, какие слова еще интереснее должны быть, тут попалась богатая ссылка, которая ведет на многие другие узлы... И т.п. Вот что вы делаете? Как со всем этим хозяйством разбираетесь? Ну, я не знаю... Открытый блокнот, куда копируются попавшиеся слова и линки для дальнейшего просмотра. Закладки, куда быстренько запихивается все для последующего разбора. Короче, все действия, связанные с организацией множества ссылок, источников, удачных ключевых слов и тп., когда ищется не что-то одно, мелкий факт, а исследуется целая новая область и интересно - хоть на первых порах - очень многое.
Как эта технология у вас устроена? Поделитесь, а? Конечно, приемы у всех "по характеру", но вдруг что-то можно будет ухватить и использовать


(Читать комментарии) - (Добавить комментарий)


(Анонимно)
2007-11-27 02:39 (ссылка)
1. Есть очень простой алгоритм, который для длинных научно-рассуждательных, заныдно-смысловых текстов дает очень хорошие результаты.

Этот алгоритм (программа в несколько строчек на Пёрле, например) применяется к первому из текстов, который вы нашли попадающим в тему.
Часто таким исходным текстом можно делать обзорную статью на тему из Википедии.

Алгоритм дает набор "характерных" для текста слов; они неочевидны - не совпадают с тем, что мозг подсказывает как "ключевые" слова по теме, хотя множества перекрываются.
Список слов несколько удивляет - потому что включает как бы "случайные" слова, неспицифичные, самого общего смысла.

Однако если их ввести в поисковик (например, Гугл), то они дадут тексты, отлично совпадающие с первым образцом не только по теме, но и по стилю.

2. Второй "трюк" - собирать специализированные поисковики и страницы со ссылками по темам.
И затем индексировать их на своей машине.

Т.е. у себя на машине держишь архив и открытый внутрь веб сервер - с поиском, через браузер, в точности как гугл.
И поиск нового начинаешь от образцов или страниц ссылок, уже лежащих в своем архиве.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2007-11-27 02:54 (ссылка)
увы, в Перле не программирую... Да и собственный сервер... Увы, это выше моего представления.

(Ответить) (Уровень выше)


(Читать комментарии) -