Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2007-11-27 07:51:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Как искать?
Это не ответ, это вопрос. Тратим мы на поиск в сети примерно 40% времени от всей длительности сидения в сети. И видно, что люди, профессионально поиском занимающиеся - умеют это делать ну очень хорошо. И наверняка приемы какие-то отработались... Я не о подборе ключевых слов и не о применяемых модификаторах запроса. Это - общая техника, каждый в меру грамотности ее использует. Я о другом. Вот новая область, - начал искать... На такой-то набор ключевых слов высыпалась неплохая инфа, надо просмотреть хоть страниц 5 поисковика, на второй странице пришло в голову, какие слова еще интереснее должны быть, тут попалась богатая ссылка, которая ведет на многие другие узлы... И т.п. Вот что вы делаете? Как со всем этим хозяйством разбираетесь? Ну, я не знаю... Открытый блокнот, куда копируются попавшиеся слова и линки для дальнейшего просмотра. Закладки, куда быстренько запихивается все для последующего разбора. Короче, все действия, связанные с организацией множества ссылок, источников, удачных ключевых слов и тп., когда ищется не что-то одно, мелкий факт, а исследуется целая новая область и интересно - хоть на первых порах - очень многое.
Как эта технология у вас устроена? Поделитесь, а? Конечно, приемы у всех "по характеру", но вдруг что-то можно будет ухватить и использовать


(Читать комментарии) - (Добавить комментарий)

Появилось время, поэтому напишу подробнее
[info]ivanstor@lj
2007-11-27 10:10 (ссылка)

может быть пригодится кому-то.

Один из конкретный алгоритм поиск в сети, которым я реально пользуюсь. Условия: предметная область, с которой не знаком или знаком в самых общих чертах.

Проблема в том, что не знаешь, о чем, собственно, спрашивать поисковики. Вот, примерно, как мы с сыном на днях реально искали в сети.

Задача. Сыну нужно было поднять полупрофессиональную студию звукозаписи: софт, железо, помещение, расценки, организация. Значит нам нужно найти сайты, где все это обсуждается. Если набрать в поисковике "профессональная звукозапись", то искомое будет на 100-й странице, в груде коммерческого мусора 1) Поэтому начинаем не с поисковиков. Подключаемся к солидному news-серверу и закачиваем список групп (конференций) (Внимание! Это не WEB). Например, news://ddt.demos.su . В селекторе групп набираем sound, вываливается длинный список

fido7.pvt.sound.pro fido7.pvt.ultrasound fido7.ru.ultrasound fido7.sound fido7.sound.uue .....

Ага, fido7.pvt.sound.pro похоже то, что надо. Pro, это как раз проф. обсуждение, а .pvt. значит приватная, то есть закрытая для записи, значит в ней не будет спама. Подписываемся на эту группу и скачиваем все сообщения, что есть на сервере. Если их много, тысячи, скачиваем последние сотни. Кроме того нужно поискать заголовки вроде "FAQ", "Правила", "Rules" они хорошо видны, т.к. регулярно постятся роботом. Попутно  смотрим по заголовкам интересные нам  темы, возможно набредем прямо на то, что нам интересно. Дальше делаем следующее: 1) Все сообщения сохраняем в текстовом формате и любой подходящей программой выуживаем URL. Завсегдатаи нередко помещают в подписи ссылки на свои сайты, а они  нам и  нужны. 2) Сообщения быстро просматриваем, начиная с FAQ и Rules. Там выуживаем ссылки и, главное, терминологию! Обращаем внимание на жаргонные словечки: название программ, железа, или реактивов каких-нибудь :-). Это очень мощные селекторы для дальнейшего поиска уже в Вебе. 3) Проходимся по выуженным на этапах 1-2) ссылкам, мы уже получили нужную информацию + на сайтах обычно есть разделы Ссылки. А ведь к поисковикам мы и не подходили!

Итак, у нас уже набрана 1) понятийная база, 2) терминология, 3) некоторое количество сайтов по теме, причем не порталов, а вполне обозримых, 4) жаргон и, наконец, 5) мы уже получили ряд ответов на вопросы.

Вот теперь можно открывать Гугль. :-)

Вместо news можно попробовать использовать любой другой сервис с разбивкой тем на категории: ××× списки рассылки (NB! слова "списки рассылки" сами по себе хороший селектор при поиске, позволяет выйти на тематический форум и дальше действовать аналогично поиску в news) ××× есть смысл  в гугле/яндексе начинать с поиска в блогах и/или группах, а уж потом переходить к сайтам ××× обратите внимание, мы сразу нашли не только информацию, но и людей. Можно попробовать позадавать вопросы, хотя осторожно, здесь, как нигде в сети, могут и послать. ××× ники/фамилии активных участников рассылок/news-групп — тоже очень хороший селектор при поиске в гугле/яндексе.

(Ответить) (Ветвь дискуссии)

Re: Появилось время, поэтому напишу подробнее
[info]ivanov_petrov@lj
2007-11-27 10:19 (ссылка)
Благодарю. Случай специфический, но стратегия видна

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Появилось время, поэтому напишу подробнее
[info]ivanstor@lj
2007-11-27 10:38 (ссылка)
Если Вы подразумевате под специфичностью тематику поиска, то это не так. Количество групп в news десятки тысяч на одном сервере и сотни тысяч всего, т.е. тематический охват довольно широкий. Я, конечно, подразумеваю и англоязычные.

(Ответить) (Уровень выше)

Re: Появилось время, поэтому напишу подробнее
[info]side_effect@lj
2007-11-27 16:23 (ссылка)
Вот теперь можно открывать Гугль. :-)

гугль можно открывать с самого начала :)
чтобы не возиться с ньюс-серверами, можно читать эхоконференции и искать в них информацию через http://groups.google.com/. причем, в гугле хранится не только fido7.*, но и все хотя бы маломальски известные буржуинские ньюсгруппы.

(Ответить) (Уровень выше)


(Читать комментарии) -