Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2011-11-07 20:13:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Образцовый поиск
Разумеется, то, что я буду говорить - банально. Интересно, насколько это банально.

Сейчас существует очень обычный и рутинной вид интеллектуальной деятельности - поиск в сети некоторой информации. Мне кажется, можно выделить три вида обращения с этой интеллектуальной операцией - сейчас будет ясно, в каком отношении выделяются эти виды.

Самый просто случай - когда вы сами нечто ищете. Вы поискали, нашли, поняли и можете сказать - я искал и вот что происходит, вот какая ситуация, вот что было.

Ситуация другого вида - когда вы кого-то посылаете поискать, чтобы он узнал. Может быть, это ученик, или аспирант, или собеседник - не важно, дело не в сценариях, когда возникает такая ситуация, она во множестве вариантов возникает. Вы кого-то отправляете в сеть искать информацию. В некотором роде вы уверены в том, что он там найдет. Или вы знаете, сами искали и нашли, или еще по какой-то причине вы обладаете безусловной уверенностью, что именно он должен там отыскать по некоторому вопросу. При этом сами вы в сеть не смотрите в этот момент - вы не ищете, но уверены в том, что он найдет, если будет искать.

Третий вид (я им и закончу, чтобы соблюсти традицию и не мучить перечислением) - когда... Будем без сценариев, ситуаций может быть очень много, я скажу всего одну, чтобы было понятно. Допустим, делается научное исследование. И человек делает замечание, ссылку: данные получены поиском в сети такого-то числа. Ставит дату, ставит поисковые слова, описывает условия поиска, адрес поисковой машины, все дела. Он документирует поиск для научной ссылки.

Теперь я и скажу ту самую банальность, о которой речь. Все эти виды поиска подразумевают, что результат поиска - нечто данное, заранее данное и известное, что это такая вещь, как кирпич, как кусок реальности - она есть, на нее можно указать пальцем. Я поискал по теме и нашел. Я послал другого искать и знаю, что он должен узнать. Я желаю точно сформулировать, как я нашел вот именно эти результаты - и я оставляю в ссылке данные поиска.

Между тем поиск - непостоянен. Если посадить рядом за компьютеры двоих людей и сказать: введите поисковое слово... в гугль, то в общем случае результат у них будет разный. С промежутком в час - совсем разный, не говоря о том, что ежели между ними несколько тысяч километров - тоже иной. Через год очень мало смысла пытаться понять, что же было найдено год назад.

Результат поиска условно-достоверен. Не по отношению к реальности, об этом и речи нет - относительно тех баз данных, которые имеются у поисковика на момент запроса. У крупного поисковика размер баз такой, что база делится на большое количество сегментов - чтобы на сервер влезала операциональным образом. Учитывая число запросов в час, сопутствующие сервисы и регулирующие поиск роботы, бяки интерфейса и прочую фигню неисчислимую, в поиске всегда что-то не работает. Говоря грубо и для простоты - для каждого запроса какая-то база не работает на момент запроса. К тому же выдача поисковика связана с другими поисковыми средствами, работающими автономно от большого поиска - какая-нибудь выдача поиска по новостям или по блогам может влиять на выдачу основного результата, а там свои косяки и висяки. И работа поисковика в том, чтобы выдать результат не слишком скособоченный относительно генеральной совокупности в базе, то есть устроить системно и организованную деградацию результатов, а не случайную, хаотическую и "крутую" на определенных участках выдачи. Тем самым, войдя в один и тот же поиск с промежутком в секунду и вводя один и тот же запрос, пользователь получает отличающиеся результаты. Там масса факторов, влияющих на это дело, но важно сознавать, насколько непостоянным является то, к чему отсылают как к чему-то устойчивому. Это такой рукотворный вероятностный мир информации, и он, вообще говоря, требует иного отношения, чем привычные со времен аристотелевой логики познавательные средства. Как, скажем, собеседник, который отвечает на вопрос по вероятностной функции - то да, то нет, и таких собеседников - миллиарды, их ответы суммируются.


(Читать комментарии) - (Добавить комментарий)


[info]pashkin_elfe@lj
2011-11-08 02:34 (ссылка)
В качестве источника научных данных в интернете есть что-то временное, несерьезное. Если ты ссылаешься на книгу или статью, она, даже если устареет, но не исчезнет из журнала. А в интернете... лабораторию закрыли, не заплатили за хостинг и все результаты просто исчезли (может быть они остались только на личных компьютерах сотрудников, а никто не вечен).

К примеру, если бы Дарвин опубликовал свои наблюдения на сайте, то нет никакой гарантии, что оригинальный текст можно было бы сегодня прочитать. Скорее всего общая идея и полемика по каким-то вопросам сохранилась бы, но чтение этого заставляло бы строить ход мыслей ученого по сохранившимся кускам. Такое "кусочное" понимание теории эволюции явно отличается от понимания тех, кто читал "Происхождение видов..."

В книге Маркова, к примеру, очень много ссылок на web-источники. Понятно, что сама книга переживет время существования многих из них. Кому-то придется читать с "битыми ссылками". Аналогом такого цитирования может быть монография где в списке литературы 70% "Частное сообщение такого-то".

(Ответить) (Ветвь дискуссии)

Надо пользоваться
[info]b_graf@lj
2011-11-08 13:13 (ссылка)
в этом случае webarchive.org (даже в Вики бывают ссылки на него, когда исходный сайт недоступен). Правда, он не все сохраняет, почему-то пропусков много - кэши поисковиков бывают более полными, но они вроде хранят данные сравнительно недолго.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Надо пользоваться
[info]fregimus@lj
2011-11-12 03:54 (ссылка)
web.archive.org, ежели не вру, с точкой.

(Ответить) (Уровень выше)


(Читать комментарии) -