|
| |||
|
|
Компьютерный пересказ текста У меня вопрос. Есть ли разработки в этом направлении? Понятно, что есть морфологический анализ слов, поисковые индесы по тексту, расстановка тэгов и ключевых слов. Переводчики. Это понятно. Но вопрос о другом: компьютерное реферирование и пересказ - развиваются? Это ведь вопрос об искусственном интеллекте. Просим - перескажи текст, не зачитай, а перескажи. Критерий. Я пока не смог понять, насколько это уже удается. "Работают над этим давно http://www.gpntb.ru/win/ntb/ntb2001/1 выработаны многочисленные подходы к решению данной проблемы, которые достаточно четко подразделяются на два направления – квазиреферирование, основанное на экстрагировании из первичных документов с помощью определенных формальных признаков «наиболее информативных» фраз (фрагментов), совокупность которых образует некоторый экстракт (квазиреферат), и собственно автоматическое реферирование, основанное на выделении из текстов с помощью специальных информационных языков наиболее существенной информации и порождении новых текстов (рефератов), в большей или меньшей степени изоморфных первичным документам (или их частям)." Как я понимаю, это работа с частоткой - выделяются значимые частые слова и ими фаршируется новый текст =автореферат. "Суть индикаторного метода заключается в использовании словарей маркеров, индикаторов и коннекторов (лексический аппарат свертывания), насчитывающих свыше 1 500 лексических единиц так называемой неключевой внетематической лексики, и формул выбора, отражающих требования к различным видам вторичных документов для машинного экстрагирования фраз, которые относятся к различным содержательным аспектам документов (в нашем случае научно-технических статей). Совокупности таких фраз, определенным образом упорядоченных, и образуют различные виды вторичных документов – основного средства информационного обслуживания." http://www.olap.ru/basic/refer.asp Системы автоматического реферирования (старый текст, 2000 г.) http://www.kansas.ru/pb/paper/rcdl2 Система автоматического реферирования новостных сообщений на основе машинного обучения http://elar.usu.ru/bitstream/1234.5 Автоматическое реферирование веб-документов с учетом запроса В системе используется восходящий к работам 1950-60-х годов подход к выделению важных предложений (sentence extraction) с небольшими модификациями. http://rcdl.ru/doc/2008/177_183_pap О методе автоматического реферирования, основанном на результатах рубрицирования документов Идея метода заключается в том, чтобы максимально использовать результаты предшествующих этапов обработки и составлять реферат после определения основных тем документа. http://www.seminarprojects.com/Thread-d Development of an auto-summarization tool http://www.informaworld.com/smpp/conten Automatic Abstracting and Summarization http://www.minesight.com/enl/February_2 http://itt.nissat.tripod.com/itt0202/ru http://www.pertinence.net/index_en.h http://www.isi.edu/natural-language/pro http://www.indiastudychannel.com/resour ---------------------------- Насколько я понимаю, пока глухо - есть очень корявые системы, на уподобление настоящему пересказу рассчитывать нечего. (C) zh3l@lj |
||||||||||||||