Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2010-09-08 12:58:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Топики 3.0
http://www.novayagazeta.ru/data/2010/099/22.html
"Web 3.0 отличается от web 2.0 тем, что пользователи не только находят или создают контент, но и сами же его фильтруют и оценивают. С точки зрения конечного потребителя, не важно, кто генерирует и размещает контент — пользователи или профи, он растет из разветвленной грибницы культуры: сотни тысяч песен в год, 250 приличных фильмов плюс десятикратно большее количество сугубо коммерческих лент, миллионы текстов, видеоблоги и т.д. Всю эту массу сообщество способно сертифицировать и расфасовать в соответствии с индивидуальными запросами людей и теми ступенями вкусовой вертикали, на которой находится каждый. Данная технология называется коллаборативной фильтрацией (от слова collaborative — «сотрудничать»). Сортировка в зависимости от воспринимаемого качества важна как для контента, так и для материальной продукции практически любых типов. Но есть область, где эта задача стоит особенно остро, — это фильтрация актуального контента.

Новости, статьи, эссе, аналитика на злобу дня, интересные ролики и фото, блоги, анекдоты и проч. — все это контент с коротким жизненным циклом, который, как ничто другое, нуждается в быстром доведении до целевой аудитории. О фильме-лауреате Каннского фестиваля рано или поздно услышишь, и его в любой момент можно посмотреть. Другое дело — быстро устаревающий контент. В настоящее время полностью отработаны технологии, позволяющие коллективно фильтровать такого рода информацию и выдать каждому то, что заинтересует его с высокой степенью вероятности. В эту подборку попадет все, что высоко оценили люди из его референтной группы. (Те, кого система вычислила в качестве вкусовых соседей, плюс те, кого пользователь сам захотел видеть в числе своих корреспондентов.)

Данная технология идеально подходит и для обработки периодики: читатели могут одним кликом получать выборку наиболее актуальных статей, опубликованных в дюжине-другой изданий. Каждый человек просматривает одно, максимум два-три издания, поэтому интересные публикации неизбежно оказываются вне его поля зрения. У других СМИ есть свои читатели, часть из которых, возможно, принадлежит к тому же кругу, что и данный пользователь. Каждый находит что-то интересное — благодаря коллаборативной фильтрации эти материалы становится общим активом клуба. На сайте f1000biology.com, например, ведущие ученые обмениваются информацией о достойных внимания публикациях. Таким образом, совершая самые обыденные действия и ничего сверх того, люди сообща нарабатывают пул лучших текстов для собственного употребления. Таким образом, технология web 3.0 позволяет на другом уровне, с иным КПД работать с медиа и специальной литературой.

Но web 3.0 не только сокращает издержки на поиск необходимой информации. Есть еще одно следствие, едва ли не более важное, — он помогает формировать те самые клубы, о которых говорилось вначале. Технология так устроена, что, прежде чем фильтровать и рекомендовать тесты, она отбирает группы людей, которым целесообразно обмениваться друг с другом опытом.

Клуб — ключевая форма бытования общества. Он не только обслуживает острейшую потребность в разного рода стратификациях, размежеваниях и объединениях. Для человека клуб — это путь к личному счастью, инструмент самореализации. Качество жизни конкретного человека зависит от того, что за люди его окружают, а также от характера взаимодействия с ними. Вступая в контакты со стоящими людьми по интересующим вопросам, человек повышает качество коммуникаций и — шире — качество личного времени. Приумножение качественного времени — цель человека, клуб — важнейший инструмент для этого, а web 3.0, в свою очередь, — высокотехнологичный инструмент формирования клубов."
-------------------

Как я понял, говорится следующее - вы в какой-то социальной сети оцениваете фильмы-книги, вам рекомендует программа познакомиться с теми, у кого сходные оценки, а потом вам при запросах наверх вытаскивают то, что, как кажется программе, интересно "такой группе", а прочее зарывает на 157-ю страницу поисковика.

Такой вот прорыв в поисковых технологиях. Кто не понял - это так поиск будет сделан. Мне в целом плевать, куда какие дураки меня классифицируют и запишут, но вот поисковая программа автоматом будет фильтровать запросы и давать подходящие тебе ответы. Чтобы было меньше лишнего шума.

Поисковик становится собранием топов - топ-100 для жжистов этой группы, топ-100 сайтов для вон той группочки... и все довольны.


(Читать комментарии) - (Добавить комментарий)


[info]leonid_b@lj
2010-09-08 06:05 (ссылка)
Это может означать, в частности, что получить нормальный результат поиска можно будет, но отдельно. Отдельно сообщив, что ты хочешь иметь результат поиска "как есть".
Т.е., те же самые новосредневековые течения. Всё можно, только сознательно.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-09-08 06:23 (ссылка)
надо полагать, за открепление от группы - бесплатного сервиса по умолчанию - придется заплатить

(Ответить) (Уровень выше) (Ветвь дискуссии)

Не обязательно
[info]leonid_b@lj
2010-09-08 06:27 (ссылка)
Но даже если так, то тут вопрос - чем именно придётся заплатить. Если деньгами, то всё нормально.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не обязательно
[info]ivanov_petrov@lj
2010-09-08 06:40 (ссылка)
за деньги помещают в особую группу, за которой следят более тщательно и строго фильтруют доступный поиск

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не обязательно
[info]petsen@lj
2010-09-08 17:14 (ссылка)
не совсем понятно все же, что такое "нормальные" результаты
Любая поисковая система, у которой есть хоть сколько-нибудь значительное количество пользователей, будет использовать пользовательские данные для ранжирования
При нынешних объемах данных ранжирование даже эффективнее фильтрации: в общих результатах ответ может быть, но на 15-16 странице его (почти) никто никогда не найдет
Соответственно, все дело в том, данные какой именно группы пользователей учтены в том ранжировании, на которое вы сейчас смотрите: более узкой и как-то с вами соотносящейся или группы пользователей данной поисковой системы вообще

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не обязательно
[info]ivanov_petrov@lj
2010-09-09 01:53 (ссылка)
Эх. Мои лично проблемы совершенно иного плана. Поисковые машины знают, что выдачу дальше первых страниц никто не смотрит. И потому халтурят неимоверно. Я же ищу и на 27й, и на 59й, и пытаюсь на 104й. Но часто таких страниц просто нет - многие результаты поиска обрываются после 20, 50 и т.п. страниц, хотя заявлено, что результатов больше. Вдруг упс! - нету. Не говоря о том, что многие поисковые результаты - не оговаривая этого - даются только за определенный срок, к примеру - полгода. Хотя индексация могла бы выдать за 5 лет, но, видимо, хочется оптимизировать время ответа, а кто ж туда полезет. Жалко.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не обязательно
[info]petsen@lj
2010-09-09 02:57 (ссылка)
> Не говоря о том, что многие поисковые результаты - не оговаривая этого - даются только за
> определенный срок, к примеру - полгода.
А вот это для меня новость. Или Вы имеете в виду, что нет версий страниц, которым больше полугода, если страница с тех пор обновлялась? Но такое действительно может не храниться в индексе из-за экономии на его размере.

> хотя заявлено, что результатов больше
О да, эту цифру, как мне кажется, никто до конца аккуратно считать не умеет -- только приближение.
Меньше страниц, чем заявлено изначально, может получаться из-за удаления дубликатов и порно, которое не всегда может делаться одномоментно для всех результатов, а происходить по мере листания.

>Я же ищу и на 27й, и на 59й, и пытаюсь на 104й.
А можете рассказать, почему приходится так делать, а не переформулировать запрос, чтобы сразу откинуть часть нерелевантных или уже просмотренных результатов?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не обязательно
[info]ivanov_petrov@lj
2010-09-09 10:50 (ссылка)
Нет, не версий. Попросту. Даешь запрос в Яндекс, идут ответы, все более старые - по хронологии, а потом бздинк - все. Нету страничек. потому что нормальный пользователь не листает запрос на глубину в 72 страницы, кого стесняться-то. И последняя дата отстоит - на несколько месяцев от современности. Иногда на год. Это специализирвоанные выдачи - не в Большом Яндексе, там тоже дурят, но не так откровенно.

Так делаю потому, что у иного искальщика может возникнуть желание посмотреть то, что нашлось. Вы мылслите в парадигме "шум,шелуха мне нужен один какой-то сайт" - а у меня может быть цель просмотреть все, что может найти такой-то запрос. Конкретные работы, в которых это надо - простите, приводить не буду. Они разные бывают.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не обязательно
[info]petsen@lj
2010-09-09 11:05 (ссылка)
А можно Вас попросить, если будут такие примеры, как в первом случае, мне скинуть? Буду премного благодарна.

Да, такую мотивацию вполне понимаю. Просто хотелось уточнить, что это цель, а не вызвано неудобством средств для решения чего-то еще.

PS. Мне кажется, я Вас немного раздражила. Простите, если что.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не обязательно
[info]ivanov_petrov@lj
2010-09-09 11:17 (ссылка)
в раздражении Вы не виноваты. у меня такое чувство, что Вы используете разные местоимения для самообозначения - наверное, кажется. в результате у меня какая-то неуверенность - то ли я помню, что с вами говорил, то ли нет. Мне без разницы, она или он, но если смилуетесь - выберете что-то одно.

Что же до примеров, то мне это странно слышать. М-да, ладно,

http://blogs.yandex.ru/search.xml?text=%D0%BC%D0%B8%D0%B3%D1%80%D0%B0%D1%86%D0%B8%D0%B8
В яндекс-блоги слово миграции

выдает сто страниц. последняя дата 30 августа 2010

Гипотезу, что до 30 августа 2010 года слово "миграции2 в блогах не употреблялось, я отвергаю

То же в других случаях.

Это можно не просить примера - просто взять и попробовать.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Не обязательно
[info]petsen@lj
2010-09-09 11:44 (ссылка)
Простите, пожалуйста. Я обычно пишу о себе, как и положено, в женском роде, но иногда прибегаю к фигуре речи а-ля "брат Пушкин". Больше не буду.

Спасибо за прииер, поняла, о чем Вы.

(Ответить) (Уровень выше)


[info]109@lj
2010-09-09 17:38 (ссылка)
global conspiracy theories - это круто. однако, если кликнуть по вашему линку, то там внизу будет написано, как отсортирована выдача. и даже кнопочка есть - "по дате обратно". и если её нажать, на первую страницу попадают посты осени 2003 года, это видимо когда яндекс начал индексировать.

а общее название проблемы, о которой пытался рассказать этот пост - search relevance (http://google.com/search?q=search+relevance), 85,900,000 results, good luck.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-09-10 01:57 (ссылка)
Смотрите, что получается. Яндекс выдает 100 страниц - это 1000 ссылок на слово и останавливается на сентябре 2010. Вы говорите мне: типа, дурак ты, там есть кнопочка. Я ее нажал, ту кнопочку - Вы не пробовали, да? Так вот, та кнопочка - обратно по дате - выдает тоже сто страниц, на другой срок - но тоже только 1000 ссылок. Да, эти ссылки рассыпаны до 2003 года. Но я в любом случае получаю 1000 ссылок- и все, а вовсе не весь перебор, не все вхождения слова. Если 1000 ссылок - это столько находится подряд (предположим) от сейчас до начала сентября, то как же получается, что столько же - до 2003 года? И где кнопочка, о которой я говорил с самого начала этого разговора - чтобы я просто получил все вхождения на данное слово.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]109@lj
2010-09-10 04:57 (ссылка)
там 137 тысяч результатов по вашему запросу. что вы будете делать с 137 тысячами? даже если тратить всего минуту на просмотр, вам потребуется сто дней. это если не пить и не спать.

моя мысль, если ещё не понятно, заключается в том, что вы требуете что-то бессмысленное, ненужное. так и хочется сказать "поэтому оно и не сделано", но даже это не так. можно ткнуть в другую кнопку, "расширенный поиск", и искать понедельно. это даст возможность просмотреть все 137+ тысяч.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-09-10 05:01 (ссылка)
понял. я хочу ненужного

(Ответить) (Уровень выше)


[info]109@lj
2010-09-10 05:02 (ссылка)
кроме того, пожаловаться на конкретного яндекса, ограничивающего выдачу тысячей ссылок, это одно (я бы и глазом не моргнул), а делать обобщения космического масштаба и космической же глупости - совсем другое.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-09-10 05:11 (ссылка)
(надуваясь от гордости) Вы считаете, что моя глупость - космического масштаба? нет, правда?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]109@lj
2010-09-10 05:37 (ссылка)
это цитата

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-09-10 05:49 (ссылка)
ааа...

(Ответить) (Уровень выше)


(Читать комментарии) -