Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dolboeb ([info]dolboeb)
@ 2004-10-28 13:50:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Настроение: pensive

Как ищут люди
В Америке выходит книжка Web Search: Public Searching of the Web. В заголовки, естественно, выносится открытие авторов, что доля поисковых запросов по сексу снизилась за последние 7 лет с 20% до 8-10% в Европе и до 5% в США. Мне, однако, больше понравился другой комментарий:
What hasn't changed much in seven years is how hard people are willing to work at searching. The answer: Not very. Spink and Jansen found that people averaged about two words per query and two queries per search session. <...> "We were surprised that people weren't doing more complex searches," Spink said. "If you put a couple of words into the Web, you're going to get hundreds of thousands of results. I think people aren't trained very well to use the search engines."

Неделю назад я писал ровно о том же, основываясь на собственном опыте. Теперь выясняется, что исследователи, потрудившиеся статистически обработать миллион запросов на предмет search patterns, пришли к тем же выводам.



(Добавить комментарий)


[info]moody_warthog@lj
2004-10-28 00:27 (ссылка)
Это напоминает историю борьбы GUI с командной строкой. Не заставишь миллионы пользователей учить Unix. Или, например, усовершенствовать собственнную логику запросов. То есть решение поблемы эффективности поиска - скорее лежит на стороне программистов, работающих над поисковыми моторами и web-сайтами. Конечно, написать такую книгу и всячески пропагандировать поисковые навыки - дело достойное. But still...

(Ответить)


[info]_ab_@lj
2004-10-28 00:53 (ссылка)
Мне кажется, в этом нет ничего удивительного. Я в большинстве случаев ввожу в поисковую строку лишь пару слов и при этом нахожу нужную мне информацию на первых двух страницах результатов поиска. Спрашивается, зачем мне составлять более сложные поисковые выражения?

(Ответить) (Ветвь дискуссии)


[info]only_you@lj
2004-10-28 10:12 (ссылка)
Тут цимус в том, что Вы интуитивно (или осознанно) набираете пару правильных слов. Большинство же -- неправильных.

(Ответить) (Уровень выше)


[info]abramz@lj
2004-10-28 01:02 (ссылка)
Полностью поддерживаю первого оратора. Авторам поисковых систем проще всего свалить все на пользователя, умолчав о несовершенстве собственного продукта.

(Ответить) (Ветвь дискуссии)


[info]yakovis@lj
2004-10-28 01:34 (ссылка)
Беда в том, что по одному слову угадать, о чем идет речь, зачастую может только телепат, а никак не программный продукт.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]abramz@lj
2004-10-28 01:54 (ссылка)
на данный момент да. Вопрос: почему в поисковиках, даже если критерии поиска определены максимально подробно, наиболее информативные сайты находятся далеко не в числе первых, если, вообще? Мне кажется, исправить это - вполне посильная задача.

Темы побочных интересов хозяев поисковиков вообще не хочу касаться.

(Ответить) (Уровень выше)


[info]tolchelnikov@lj
2004-10-28 01:35 (ссылка)
Полагаю, что это не так.
Движок проиндексировал все, что надо и найдет то, что требуют. А вот запрос невербальный в поисковую фразу он ну никак перевести не сможет.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]abramz@lj
2004-10-28 01:55 (ссылка)
простите, что значит "невербальный запрос"?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]tolchelnikov@lj
2004-10-28 02:02 (ссылка)
--простите, что значит "невербальный запрос"?

Это когда хочется найти "лучшие венгерские диско композиции 70х годов" а пищут "музыка венгрия 70".
Невербальным будет тот, что был у запрашивателя в голове. К сожалению, восстановить его по реально введенной поисковой фразе, мягко говоря сложно.

(Ответить) (Уровень выше)


[info]moody_warthog@lj
2004-10-28 01:42 (ссылка)
справедливости ради надо сказать, что, собирая статистику запросов, авторы исследования не столько надеялись усовершенствовать род человеческий, сколько подсказать программистам, как им усовершенствовать их продукт, ориентируя его на среднего статистического гая с его непреодолимыми ограничениями.

And it's why search engine companies — and the creators of the Web pages they're sifting through — are trying to develop technology to help computer users hone in on desired results and filte— out the rest.
----
оффтоп:
hone in on desired results .... 'заточить' под результат. Всегда думал, что 'заточить что-то подо что-то' это специфическое русское постперестроечное выражение. Ан нет.
мммм .... уж не Брин ли писал аннотацию? :)

(Ответить) (Уровень выше)


[info]dolboeb@lj
2004-10-28 02:25 (ссылка)
Поисковики требуют ровно столько же умения и навыка, сколько управление автомобилем. Не Бог весть какая наука - крутить рулем и переключать с Parking на Drive или Reverse.

Но Вы же не будете сваливать на автопроизводителя ответственность за все аварии, в которые попал человек без прав и опыта вождения.

Та же история с поиском в Интернете. В одном и том же Яндексе неленивый пользователь находит в 100 раз больше полезных для себя вещей, чем ленивый. Валить ответственность за это на Яндекс - это с больной головы на здоровую.

Коммерческое давление на поисковики приводит как раз к тому, что в транзакционном поиске (поиск товаров) дела идут чем дальше, тем хуже. У крупных брендов, у которых в России самые высокие цены в силу сопутствующих затрат, есть больше денег на выкуп контекстной рекламы и на поисковую оптимизацию, чем у мелких фирмешек, которые забыли включить в цену того же самого товара аренду мегаофисов, квадратный километр наружки и сайт от Темы Лебедева. Поэтому за неумение искать платит сам пользователь.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vnarod@lj
2004-10-28 03:00 (ссылка)
Я шесть с половиной лет работал над разработкой хорошего поисковика (search engine). С 91 по 97 год. Авторитетно заявляю - 90% успеха зависит от качества поисковика, а не от запроса. Хороший поисковик анализирует:
Насколько часто слово встречается в тексте, длину текста, частоту слова во всей базе данных, слова наиболее часто встречающиеся вместе с этим словом, взаимное соотношение частоты введённых слов в данном документе и относительно всей базы (в запросе "президент Буш Ирак" сочетание "Буш Ирак" важнее чем "президент Буш"), сочетания наиболее часто сопутствуюших слов, и многое ещё. Даже по "музыка Венгрия 70" хороший поисковик будет близок к тому, что надо.
Если интересно могу поискать ссылку на наш патент.
Для плохого поисковика использование лишнего слова ухудшает результаты поиска, хотя бы потому, что он не учитывает все синонимы.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2004-10-28 03:56 (ссылка)
Похоже, развитие поисковиков за последние 7 лет как-то оказалось вне сферы Вашего внимания. Принципы, которые Вы формулируете выше, тем или иным способом благополучно имплементированы и в Гугле, и в Яндексе, и в Рамблере, и в новорожденном MSN Search. И примерно эффективность поиска во всех перечисленных машинах одинаково высокая, если уметь искать. А если не уметь искать - одинаково низкая.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vnarod@lj
2004-10-28 04:05 (ссылка)
Совсем наоборот, я очень внимательно слежу за всеми событиями в этой области. То, что я сформулировал выше это действительно всего лишь принципы, не писать же тут трактат на 20 листов. Эти принципы используются везде, как например, принцип камеры Обскура в фотографии (а качество аппаратов разное). Но используют по разному, с разными формулами и коэффициентами. Поверьте, это очень важно. Простая замена функции квадратного корня на логарифм уже даёт заметное отличие, вычислений там очень много.
Эффективность поиска всех распространённых поисковиков сильно различается. Если не лень попробуйте один и тот же большой запрос в разных местах и проведите исследование.
Сравнивать методы напрямую не получается поскольку только Гугл открыто выложил свои алгоритмы в интернете.

(Ответить) (Уровень выше)


[info]mikev@lj
2004-10-28 05:39 (ссылка)
Почему-то многие поисковики, включая Яндекс, декларируют "запросы на естественном языке". Должно быть все-таки ставится цель обеспечить возможность более или менее эффективного поиска для пользователя без навыков, хотя цель эта еще достаточно далека.

Во время оно даже телевизор у "специалистов" стоял весь раскрытый, и они при необходимости подкручивали потенциометры. Остальные смотрели мутную картинку. Когда телевизеры стали совершеннее, качество картинки стало у всех почти одинаковым.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2004-10-28 11:58 (ссылка)
Потому что, извините, телевизионная картинка не интерактивная, и не выдается on demand.
В противоположность поисковику.
Где каждому дается то, что он попросил, а не некий универсальный ответ на все вопросы, типа 42.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mikev@lj
2004-10-28 19:52 (ссылка)
К моему глубокому сожалению, содержание телевизионной картинки, действительно, не интерактивное. Но КАЧЕСТВО ее очень даже интерактивное. Об этом свидетельствует множество ручек на телевизоре, особенно на старом: "частота кадров", "яркость" и т.п.

С другой стороны, в самом деле бывает обидно, когда высокое искусство, доступное Мастерам, превращается в рутину, которая по плечу каждому профану. К счастью, как мне кажется, с поиском это произойдет не скоро.

(Ответить) (Уровень выше)


[info]moody_warthog@lj
2004-10-28 04:40 (ссылка)
В моем представлении (не профессионал) речь идет о том, что идеальные поисковики могли бы помогать пользователю выстраивать логику запроса еще до его осуществления. Ибо основная проблема именно в этом. То есть видится некий интерактивный интерфейс - поводырь, для программной реализации которого и нужны сведения о том, что из себя представляет средний статистический запрос. Который бы -опционом- спросил бы, какого свойства музыку желает получить жаждущая душа на выходе - straight или же все-таки gay?

Если пользователь не нуждается в костылях, то такую штуку можно было бы отключать и тд.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dolboeb@lj
2004-10-28 14:34 (ссылка)
Это есть тот самый хелп, он же RTFM, которого так боятся люди из расселовской хохмы.
Что вместо сел-поехал их заставят сначала узнать, что первая скорость - это налево и вперед, а четвертая - направо и назад.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]moody_warthog@lj
2004-10-28 20:06 (ссылка)
На многоих машинах с ручной коробкой на приборной доске установлены индикаторы переключения передач, подсказывающие водителю-лэймеру, что пора двинуть рычаг направо и назад.

Если верить акроним_файндеру (http://www.acronymfinder.com/af-query.asp?String=exact&Acronym=RTFM&Find=Find), то RTFM, помимо Read the F**KING MANUAL, означает Realtime Traffic Flow Measurement (Internet RFCs 2720-2724).

Своевременное переключение передач помогает сохранять окружающую среду. По аналогии - была бы на клиентской части 'расческа', помогающая причесать запрос, возможно, глобальный RTFM-приборчик реже зашкаливало бы.

Интересно, сколько "весит" средний плохо сформулированный запрос, и какую часть интернет-траффика составляют такие запросы?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]moody_warthog@lj
2004-10-28 20:14 (ссылка)
то есть, естественно, речь о "весе" ответа/ответов на такой запрос.

(Ответить) (Уровень выше)

по поводу автомобильной метафоры
[info]mikev@lj
2004-10-29 01:10 (ссылка)
цитата (http://live.psu.edu/story/4836) из упомянутого выше Jansen'а
"If you can type and spell -- and most search engines help with spelling -- then you can pretty much conduct Web searches," Jansen said. "It's like today's cars: If you can turn the key, you don't need to know much else about the automobile."

(Ответить) (Уровень выше)


[info]acideye@lj
2004-10-28 06:25 (ссылка)
а ещё где то на эту тему написали, что два слова это среднее для мужчин, а для женщин - три :)

(Ответить)