Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет dolboeb ([info]dolboeb)
@ 2007-12-12 14:06:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Завтрашний день мультимедийного поиска
Записал вчера в Коммерсанте-Видео колонку про новый яндекс.поиск по картинкам.
(Как смонтируют — дам тут ссылку).
Мне кажется, что покуда мы тут обсуждаем Web 2.0 и соцсети, реальной интернет-революции завтрашнего дня стоит ждать как раз на этом направлении.

Ведь веб сегодня, как в прошлом тысячелетии, остаётся исключительно текстовой средой. По сути дела, тут доступна только та информация, которая текстуально описана и размечена — и только для ищущих на том языке, на котором её разметили. Это касается и изображений, и музыки, и видеоматериалов. Хотя мультимедийных файлов в Сети доступны сотни миллионов, большинство из них нельзя удовлетворительно выявить поиском, покуда алгоритмы индексации не лезут внутрь и не умеют внятно анализировать содержимое, а довольствуются лишь учётом сопроводительных текстовых меток.

Понятно, что дефицит удачных решений в области содержательного мультимедийного поиска — не чей-то досадный недосмотр. Анализировать сюжеты графических файлов, угадывать мелодию, расшифровывать речь из видео- и аудиопотока разработчики поисковых машин пытаются уже не первый десяток лет. Скажем, АльтаВиста в свои лучшие времена тестировала видеопоиск ещё на трансляции слушаний по импичменту Клинтона... Скромные успехи связаны в первую очередь со сложностью задачи (вплоть до неосуществимости на современном этапе).

Технология, представленная Яндексом в партнёрстве с Picsearch, увы, не даёт пока оснований для того, чтобы говорить о революционном прорыве в анализе изображений. В новой искалке достоверно анализируется лишь ограниченный набор признаков, имеющих отношение больше к техническим свойствам файла, чем к его сюжету (последний по-прежнему берётся из текстовых меток). Picsearch в этом смысле продвинулся дальше, используя смысловой рубрикатор сюжетов, наподобие тех, которые можно встретить в фотобанках. Но построение такого рубрикатора с заявкой на универсальность — адской сложности логическая задача, причём скорей для мозгов, чем для вычислительной техники. А покуда нет универсальности, нет и удовлетворительной надёжности поисковых алгоритмов. Если поисковик справляется с задачей анализа, условно говоря, на 20% или 40%, то он по-прежнему не дотягивает до уровня качества выдачи, который уже достигнут поиском по текстовым меткам. Революция случится лишь тогда, когда от залезания внутрь мультимедийного файла качество выдачи повысится по сравнению с нынешним набором находок.

Один из создателей Last.FM Мартин Штиксель, с которым я в конце ноября обсуждал ту же проблему применительно к аудиофайлам, настроен вполне оптимистично. На базе Last.FM с лета проходит публичный тест технологии fingerprinting, которая позволяет анализировать и узнавать аудиофайлы не по рукописным ID-тегам, а по внутренней их нетекстовой структуре. Пока что речь идёт о standalone-приложении, собирающем "отпечатки пальцев" с десятков миллионов MP3-файлов на дисках бета-тестеров; однако же Штиксель обещал, что в ближайших релизах аудиоскробблера эта функциональность (присутствующая там с версии 1.4.0.0, т.е. со 2 ноября) перейдёт из пассивного состояния в активное. Таким образом создатели Last.FM надеются убить двух зайцев: покончить с неразберихой в каталоге и значительно повысить релевантность выдаваемых системой рекомендаций. Надеюсь, что в обозримом будущем мы увидим какие-нибудь внятные успехи на этом направлении. Переход от "музыки, похожей по демографии/тегам" к "музыке, похожей по звучанию" в самом деле должен сотворить с рекомендательным сервисом чудеса.

А сотворит ли — посмотрим.


(Добавить комментарий)


[info]redguy@lj
2007-12-12 08:12 (ссылка)
с новыми сонериками идет софт умеющий анализировать музыку. на телефоне достаточно выбрать соответствующее музыкальное настроение и будет играть похожая по настрою музыка из всей коллекции.

(Ответить) (Ветвь дискуссии)

))))))))))))
[info]magifico@lj
2007-12-12 08:14 (ссылка)
опоздал йа(

(Ответить) (Уровень выше)


[info]magifico@lj
2007-12-12 08:13 (ссылка)
В walkman сониериков такая функция уже года три существует.

(Ответить) (Ветвь дискуссии)


[info]aleks_vk@lj
2007-12-12 12:15 (ссылка)
называется MusicID (http://www.gracenote.com/business_solutions/mobileMusic/) от Gracenote

этот сервис уже встроен в новый Winamp (http://www.winamp.com/), с версии 5.5 кажется

Image

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]illyn@lj
2007-12-14 21:09 (ссылка)
Раньше, но он поменялся в худшую сторону.
Ранее был устроен следующим образом

(Ответить) (Уровень выше)


[info]letaet@lj
2007-12-12 08:13 (ссылка)
Самое смешное, Борисыч, что еще в 97-м году я получил "стипендию Шапиро" на два года - под написание поисковой системы, которая будет распознавать картинки. Просто все мои научные труды были про распознавание, вот я и... Выписавший стипендию Исраэль Палхан был несколько удивлен моей наглостью, но решил не мешать развлекаться. В итоге, все удовлетворились книжкой про тырнет и простеньким мегапоиском научной информации.

(Ответить) (Ветвь дискуссии)


[info]cuarto_oscuro@lj
2007-12-14 06:45 (ссылка)
Смешно.

(Ответить) (Уровень выше)


[info]ex_gavarun@lj
2007-12-12 08:21 (ссылка)
если я ничего не путаю, в 2007-м офисе есть поиск по тексту на картинке, было бы круто, если бы в поисковиках это реализовали

(Ответить)


[info]dadcaptain@lj
2007-12-12 08:37 (ссылка)
Я понимаю, что вопрос возможно не по адресу, но почему никто до сих пор не научился в опциях расширенного поиска по картинкам давать пользователю задавать банально размер картинки в пикселях - регулярно хочется искать строго 16х16 или 32х32 и т.д. и никто не дает.

(Ответить)


[info]breqwas@lj
2007-12-12 08:43 (ссылка)
> Переход от "музыки, похожей по демографии/тегам" к "музыке, похожей по звучанию"

...уже давно состоялся. Называется - Music Genome Project, реализован в радиостанции Pandora. Ей надо сказать название группы либо трека, и оно станет играть похожую музыку.

Проблема состоит в том, что оно работает. И работает слишком хорошо. Если ей написать Led Zeppelin - оно будет играть музыку, похожую по звучанию на Led Zeppelin. Но совершенно не факт, что она будет так же хороша, как Led Zeppelin. Через полчаса - надоедает.

Увы, теперь оно уже недоступно из России.

(Ответить) (Ветвь дискуссии)


[info]poi2punk@lj
2007-12-12 09:01 (ссылка)
pandora самый крутой музыкальный сайт. мы всей тусовкой просто болели пандорой пока её не закрыли для россии=\

при этом пандора всё равно опирается на приписаные каждой группе или композиции наборы тегов, а не разбирает само звучание.

то есть вводя "Лед Цепелин" оно тебе будет предлагать банды и треки где в тегах найдет "classic rock roots", "strong male vocals" ну и так далее..

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]breqwas@lj
2007-12-12 09:04 (ссылка)
Я в курсе.
It just works, а остальное неважно :)

Ну то есть - на любую сколько-нибудь известную группу оно мне давало большую и действительно релевантную подборку.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]poi2punk@lj
2007-12-12 09:13 (ссылка)
ты не поверишь=) оно мне давало охренительные подборки на совершенно местечковые банды=)

закрыли пандору для россии=\ закрыли...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bjick@lj
2007-12-12 11:09 (ссылка)
кстати, как-нибудь анонимизироваться через прокси не получается?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]poi2punk@lj
2007-12-12 11:33 (ссылка)
не

(Ответить) (Уровень выше)


[info]sencho@lj
2007-12-12 20:10 (ссылка)
а почему закрыли?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sencho@lj
2007-12-12 20:16 (ссылка)
сейчас у них на сайте прочитал, что они сейчас работают только в штатах. но у меня в англии пашет на отлично :)

(Ответить) (Уровень выше)


[info]illyn@lj
2007-12-14 21:13 (ссылка)
Совсем-совсем по звуку подбирает другая технология, она локальная, от предиксиса (русскими основанной компанией, кстати).

(Ответить) (Уровень выше)


[info]ailon@lj
2007-12-12 12:01 (ссылка)
Там ведь ручками это все делалось, но делалось очень хорошо. Рекоммендации ласт.фм нервно курят в стороне. Только вот с менеджерами/юристами у пандоры плохо. Непонятно мне почему ласт.фм работает во всем мире, а пандора только в штатах.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]illyn@lj
2007-12-14 23:04 (ссылка)
А компьютером тоже есть технология, она локальная, от предиксиса в винампы встраивалась раньше.

(Ответить) (Уровень выше)


[info]sashachist@lj
2007-12-12 08:44 (ссылка)
в моем sony ericsson
есть прога track id
использовал раз 30 - подносил к источнику звука - по радио, телевизору - он безошибочно выдавал исполнителя, альбом и трэк

(Ответить)


[info]eterevsky@lj
2007-12-12 09:40 (ссылка)
Секундочку. Программы, определяющие музыку по finger print'у -- это такой боян, что мне казалось, для всех приличных плееров уже несколько лет есть такие плагины. Самый удачный и распространённый проект -- www.freedb.org, сменивший ставший коммерческим cddb.

(Ответить) (Ветвь дискуссии)


[info]sobaker@lj
2007-12-12 11:22 (ссылка)
Он определял музыку только по целому диску, используя в качестве идентификатора совокупность продолжительностей треков (или вроде того).

А чисто по звучанию - это http://www.musicbrainz.org/, например

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]eterevsky@lj
2007-12-12 13:05 (ссылка)
Если я не ошибаюсь, это cddb определял только по целому диску. А freedb, мне казалось, делал это и по отдельным трекам. MusicBrainz это тоже умеет. И foosic (http://foosic.org).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sobaker@lj
2007-12-13 04:48 (ссылка)
Нет, freedb тоже считает уникальный ID для целого диска и не умеет определять отдельно взятый трек.
Foosic у меня не открывается сейчас, увы.

(Ответить) (Уровень выше)


[info]eterevsky@lj
2007-12-12 13:09 (ссылка)
Во всяком случая, мне точно случалось проставлять с помощью freedb тэги для набора mp3-файлов.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sobaker@lj
2007-12-13 04:41 (ссылка)
Ну естественно. Попробую догадаться: набор mp3-файлов представлял собою оцифрованный диск. В таком наборе, естественно, сохраняется длительность всех треков и их последовательность.

(Ответить) (Уровень выше)


[info]webid_studio@lj
2007-12-12 09:54 (ссылка)
яндекс еще и нано открыл.

(Ответить)


[info]sinodov@lj
2007-12-12 10:26 (ссылка)
Антон Борисович, что вы. "Яндекс" не представил никакой технологии. Он лицензировал поиск у Picsearch.

(Ответить)


[info]letchik@lj
2007-12-12 10:58 (ссылка)
AudioID (http://www.m2any.com/) уже черт знает сколько времени работает

(Ответить)

а сможет он отличить мое фото до выходных и после?
[info]kuzmaholodcoff@lj
2007-12-12 11:34 (ссылка)
мое фото до выходных и после? особенно в праздники!!!

(Ответить)


[info]nickolas_basile@lj
2007-12-12 12:07 (ссылка)
По слову "елка" и по типу "фото" он находит фотки певицы Елки. Удивительная ре-ле-ват-ность или как её там.

(Ответить)

Работы в направлении поиск в аудио идут полным ходом
[info]boytsov@lj
2007-12-12 12:14 (ссылка)
Есть такой отечественный стартап www.tellicity.ru -- пока в ранней стадии, и выложено простое демо.
Делают поиск по русским аудио-записям (аудио в видео, тоже считается за аудио :)
Вроде как уникальная разработка для русского языка. Для инглиша есть несколько довольно успешно развивающихся проектов: www.blinkx.com, www.everyzing.com, www.pluggd.com, www.tveyes.com, а для русского никто ничего толком еще не сделал.

Разработчики пока ищут инвесторов: http://alex-ksy.livejournal.com/2888.html
Надеюсь не слишком долго придется ждать результатов. Для поиска было бы действительно революционно. Да и не только в этой сфере применение будет.

К слову о музыке -- с подобным же подходом к анализу аудио, наверняка можно музыку научиться анализировать детально, выделять множество параметров, в том числе таких "человеческих" как настроение. Тогда музыкальные сайты смогли бы предлагать музыку куда более сочетаемую и "прущую" -)
Хотя, это наверное "послезавтрашний" день и-нет революции :)


(Ответить)


[info]dimorlus@lj
2007-12-12 12:48 (ссылка)
Я думаю, от программ, умеющих найти похожую по настроению/звучанию/психологическому воздействию музыку/фото/видео до программ, синтезирующих по заказу то, чего хочет пользователь полшага. Напишешь ей "подрочить" - она и сварганит видео с нужной данному дрочеру порнухой...

(Ответить)


[info]nikitanikitin@lj
2007-12-12 15:15 (ссылка)
Музыка, которая нравится одному человеку различна по звучанию. То есть, если мне нравится нечто, я, ища похожее по звучанию, на самом деле хочу найти то, что мне тоже понравится. А, даже если машины будут анализировать музыкальную композицию, набор инструментов и т.п., это не будет иметь смысла, относительно моей цели. На одних и тех же инструментах с одного и того же листа можно сыграть разную музыку. Это внерационально и не может быть оценено алгоритмически. В чём смысл такого поиска?

(Ответить) (Ветвь дискуссии)


[info]skuzn@lj
2007-12-12 15:51 (ссылка)
я хочу по куску из песни понять что за песня и кто исполнитель
особенно хотелось бы, чтобы это работало с опцией "рабинович напел" :)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]nikitanikitin@lj
2007-12-12 15:53 (ссылка)
Да, об этом я не подумал.

(Ответить) (Уровень выше)


[info]raptor_r@lj
2007-12-12 17:36 (ссылка)
Сайт www.moskva.fm, как раз этим и занимается.
Но не с предложенными вами песнями, а с радиоэфиром. Так что технология существует.

(Ответить) (Уровень выше)


[info]raptor_r@lj
2007-12-12 17:56 (ссылка)
К слову, очень забавный поисковик:
http://www.quintura.ru/
В режиме картинок получается еще смешнее.

(Ответить)


[info]sfajrat@lj
2007-12-12 20:28 (ссылка)
насичёт инфы про ласт.фм спасибо

(Ответить)


[info]sfajrat@lj
2007-12-12 20:32 (ссылка)
Антон, а ты юзаешь Wakoopa (http://wakoopa.com/)?
если нет, то почему?

(Ответить) (Ветвь дискуссии)

Я попробовал и не понял
[info]lepin@lj
2007-12-19 14:25 (ссылка)
Концепция монтирить использование программ и предлагать новые на основе совпадения привычек с другими пользователями - это занятно.
Но мониторить оно мониторит, а толку от этого никакого не видно. В чем смысл то, зачем?

(Ответить) (Уровень выше)

похожесть по википедии
[info]4el@lj
2008-01-31 04:37 (ссылка)
похожесть всё-таки должна быть скорее культурной, чем структурной
вариант культурной похожести:
находим статью про группу/направление в википедии и выходим по ссылкам на другие группы/направления. чем короче путь, тем сильнее похожесть.

(Ответить)