шагом вперед Приснилось, как решать
ту фундаментальную проблему. Причем приснилось явно по мотивам какого-то поста
silkin@lj, точнее не поста, а меток к посту, прочитанному перед убыванием в сон. Эти метки произвели на меня благоприятное впечатление своей, хм... ортогональностью и способностью хорошо разлагать текст на независимые составляющие. Возможность разложения на меня "прыгнула двумя ногами". Ночью это было неосознанное впечатление, а утром нарисовался такой рекурсивный сценарий.
Шаг 1 (Анализ). Все спектакли из начального набора связываются с каждой меткой из Канонического Набора Независимых Меток (КННМ)*. Связи могут быть положительными или нулевыми.
Шаг 2 (Синтез). Каждый спектакль по очереди порождает новые метки, которые вводятся в КННМ.
Шаг 3. Повторение Шага 1 с учетом обновленного КННМ.
*Этот набор пуст на первом шагу.При появлении нового спектакля, вся операция повторяется опять.
Таким образом мы получаем самопорождающую документно-терминологическую матрицу (document term matrix). ДТМ далее используется для построения контекстуально-сетевого графа, как описано в вышеприведенной ссылке.
Офф: Любимый Пашис: