Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2009-08-18 18:08:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Как сделать?
Почти все источники в сети представляют собой ленты. Ленты новостей, календарные и пр. Вот ЖЖ тоже представляет собой ленту. С ней всё понятно, но известное дело - ушедшее в прошлое исчезает из внимания. Пост двухгодичной давности почти недоступен. Да, понятно - есть поиск. Им мало кто пользуется. Можно сказать: кому надо, тот найдёт. - Сказать можно всё что угодно. Однако это не ответ, а отмазка - ответом будет совокупность средств, представляющих в удобной для читателя форме большой материал, представленный в виде ленты.

Известно - пробуют издавать из Живжурналов книги. Как кажется - не очень успешно. По крайней мере это не панацея - далеко не всё удобно представить бумажным кирпичом. Можно делать оглавление - это тоже будет очень-очень длинная лента названий. Можно делать иерархический каталог. Там невнятная для читателя логика. Можно делать облако тэгов. Его понятность целиком зависит от понятности для читателя ключевых слов, годится только для тем новостного потока - когда в обществе имеется согласие, что как называть. Шаг в сторону, к нетривиальному знанию - всё, провал, это называется одним образом, а человек и не знает, что то, что его интересует, здесь называтся вот так. Не говоря о том, что тэги - это всего лишь одноуровневая иерархия, а значит их немного, или они нечитаемы.

Между тем существует интерес просвещенческого, образовательного характера. Человек интересуется опровержением законов Ньютона и загадкой "Пионеров", причинами направленности биологической эволюции и степенью представленности в сети разных наук и областей знания. Одно можно поискать по ключевому слову, но не так уж просто - надо подумать, как лучше построить запрос. А другое - о мере представленности в сети - вообще не ловится. Нужны люди, досконально знающие _всю_ литературу по теме, и что из нее представлено в сети, и дающие заключение - в сети есть ... 0.5? 30? 98% источников по теме.

И вот такой, довольно интеерсный и редкий материал лежит в сети - с оценками представленности - но как сделать это ушедшее в прошлое - доступным и теперь? Нужен, наверное, какой-то интерфейс. Есть ведь люди. занимающиеся этим профессионально - и не обязательно столь ограниченные, чтобы отвечать так, как на такие вещи отвечают в коммерческих разработках ("это слишком сложно, это не будут покупать, в сети 2% пользоватаелей, кому это надо - не имеет смысла для них огород городить"). Если без этих смешных - если серьезно - коммерческих отмазок, а на самом деле подумать - что можно тут предложить для тысячи десятков тысяч людей, которых такие вещи интересуют.

Пришла в голову смутная мысль. Почти все такие интерфейсы-указатели работают с повышением формализации и понижением содержательности, то есть богатым содержательным текстам ставится в соответствие формальная простая система - каталог, указатель, метка и пр. Идет сильнейшее вырождение смысла - потому и трудно искать-то. Потому в одном смысле искать легко, а в другом трудно. Может быть, делать не столь вырожденные системы? Например, краткий текст, нечто вроде резюме, но не формальный, целостный текст, почти каждая фраза которого служит отсылкой на текст или совокупность текстов в ленте. Сам такой текст содержательно и внятно объясняет, что говорится во всей совокупности подчиненных текстов, и является одновременно оглавлением - своеобразным, совмещенным с содержательным рассказом.

Таких текстов мало того что может быть несколько - довольно много; они еще могут дублироваться. То есть любой (?) читатель, взяв ленту, может сделать такой рассказ и по технологии вики (примерно) написать свой текст-обзор. Они могут различаться совокупностью текстов, на которые отсылают их ссылки, но - в пределе - на одну совокупность текстов может быть несколько "рассказов" - обрисовывающих дело с разных сторон в разных словах.

Да, это интеллектоемкая технология, такие тексты надо писать и их надо с некоторым усилием читать - это не бездумные операции. Но - может быть - для тех немногих процентов людей, кому все это надо, такие действия и не будут против шерсти.

Или что-то другое придумать? какие есть технологии внятного представления большого текстового материала?


(Читать комментарии) - (Добавить комментарий)


[info]anhinga_anhinga@lj
2009-08-28 14:43 (ссылка)
Поиск в лентах и алгебра конструирования лент меня очень интересуют (мне очень не хватает хороших средств, чтобы это делать).

Надо сказать, что к этой задаче я привык подходить совсем по-другому, чем к поиску в сети. С одной стороны, я обычно считаю, что каждый такой поиск происходит в не очень большом пространстве (что не строятся отрезки ленты, превышающие миллионы, ну, может быть, десятки миллионов сообщений). Может быть, это и неверно с моей стороны. Но при таком подходе, действительно можно "потрогать" каждое сообщение, и есть естественный порядок и естественный "ключ".

При этом, если говорить про алгебру конструирования лент, то, видимо, надо ограничиваться операциями линейной (или почти линейной) сложности, и ключевыми становятся всякого рода фильтры (они же "наблюдатели").

> В совокупном объёме конспектов получаестся, возможно, даже больше, чем в исходном тексте, но что мы имеем? Сравним с механизмом слуха: разные "кольца" в улитке реагируют на разные частоты, а потом потоки от них "склеиваются" в мозгу. Выходит, если грамотно выстроить наблюдателей, и посмотреть, кто по проходящей ленте "звенит" - мы имеем аналог преобразования Фурье. И далее этот преобразованный поток можно как-то дальше трансформировать, чистить, и прочее... Как тебе?

Да, вот это очень хорошо.

> Чего я не очень хорошо понимаю - что такое ассоциации в этой схеме.

Во-всяком случае, та же технология, что применяется для изготовления спам-фильтров, и разные вариации на эту тему (всякие классификаторы), может использоваться и здесь. Я как раз немножко прикасаюсь к этому в последнее время..

> Может, кто-то продвинулся дальше в этой схеме? Не знаешь? Я, собственно, не против был бы из неё что-нибудь работающее сварганить.

Я как раз сейчас на это буду опять смотреть. Собственно, как из классификатора сделать фильтр на RSS, это должно быть совсем просто (мы, наверное, это попробуем в рамках одного проекта, с которым я тут играю). А более хитрые вещи, особенно разумную алгебру/систему для конструирования ленты, -- это надо поискать. Всяких feed aggregators (http://en.wikipedia.org/wiki/List_of_feed_aggregators) какое-то нездешнее количество, но дает ли хоть кто-то из них разумную алгебру для создания интересных лент, я не знаю.

Давай попробуем держать друг друга в курсе относительно всяких находок на эту тему.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kormitigrov@lj
2009-08-28 15:09 (ссылка)
А можете меня тоже в курсе держать? :) Мои 5 копеек примерно здесь: http://kormitigrov.livejournal.com/100527.html
В моем понимании ленты агрегируются в том смысле, что они во-первых, взвешены, во-вторых, категорированы (теги с системой отношений родитель-предок), а в-третьих, и в главных - сообщение, встреченное в нескольких лентах, получает повышенный ранг в результате.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]anhinga_anhinga@lj
2009-08-28 20:42 (ссылка)
> А можете меня тоже в курсе держать? :)

Постараюсь :-) Ну и, симметричная просьба :-)

(Ответить) (Уровень выше)


[info]russhatter@lj
2009-09-02 12:04 (ссылка)
Пошли мне письмо на мэйл, я твой адрес потерял, если он у меня вообще был. Мой адрес засвечен в моём профайле.

(Ответить) (Уровень выше)


(Читать комментарии) -