Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2010-07-13 07:42:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Компьютерный пересказ текста
У меня вопрос. Есть ли разработки в этом направлении?
Понятно, что есть морфологический анализ слов, поисковые индесы по тексту, расстановка тэгов и ключевых слов. Переводчики. Это понятно. Но вопрос о другом: компьютерное реферирование и пересказ - развиваются?

Это ведь вопрос об искусственном интеллекте. Просим - перескажи текст, не зачитай, а перескажи. Критерий. Я пока не смог понять, насколько это уже удается.

"Работают над этим давно http://www.gpntb.ru/win/ntb/ntb2001/12/f12_03.htm
выработаны многочисленные подходы к решению данной проблемы, которые достаточно четко подразделяются на два направления – квазиреферирование, основанное на экстрагировании из первичных документов с помощью определенных формальных признаков «наиболее информативных» фраз (фрагментов), совокупность которых образует некоторый экстракт (квазиреферат), и собственно автоматическое реферирование, основанное на выделении из текстов с помощью специальных информационных языков наиболее существенной информации и порождении новых текстов (рефератов), в большей или меньшей степени изоморфных первичным документам (или их частям)."

Как я понимаю, это работа с частоткой - выделяются значимые частые слова и ими фаршируется новый текст =автореферат.

"Суть индикаторного метода заключается в использовании словарей маркеров, индикаторов и коннекторов (лексический аппарат свертывания), насчитывающих свыше 1 500 лексических единиц так называемой неключевой внетематической лексики, и формул выбора, отражающих требования к различным видам вторичных документов для машинного экстрагирования фраз, которые относятся к различным содержательным аспектам документов (в нашем случае научно-технических статей). Совокупности таких фраз, определенным образом упорядоченных, и образуют различные виды вторичных документов – основного средства информационного обслуживания."

http://www.olap.ru/basic/refer.asp
Системы автоматического реферирования
(старый текст, 2000 г.)

http://www.kansas.ru/pb/paper/rcdl2007.pdf
Система автоматического реферирования новостных сообщений на основе машинного обучения

http://elar.usu.ru/bitstream/1234.56789/1424/1/IMAT_2005_25.pdf
Автоматическое реферирование веб-документов с учетом запроса
В системе используется восходящий к работам 1950-60-х годов подход к выделению важных предложений (sentence extraction) с небольшими модификациями.

http://rcdl.ru/doc/2008/177_183_paper20.pdf
О методе автоматического реферирования, основанном на результатах рубрицирования документов
Идея метода заключается в том, чтобы максимально использовать результаты предшествующих этапов обработки и составлять реферат после определения основных тем документа.

http://www.seminarprojects.com/Thread-development-of-an-auto-summarization-tool
Development of an auto-summarization tool

http://www.informaworld.com/smpp/content~db=all~content=a917618494
Automatic Abstracting and Summarization

http://www.minesight.com/enl/February_2010/February_English/Seminar_abstracts.pdf

http://itt.nissat.tripod.com/itt0202/ruoi0202.htm

http://www.pertinence.net/index_en.html

http://www.isi.edu/natural-language/projects/SUMMARIST.html

http://www.indiastudychannel.com/resources/12455-Development-an-auto-summarization-tool.aspx
----------------------------
Насколько я понимаю, пока глухо - есть очень корявые системы, на уподобление настоящему пересказу рассчитывать нечего.
(C) [info]zh3l@lj


(Добавить комментарий)


[info]werdender@lj
2010-07-13 01:10 (ссылка)
В эпоху алгоритмческого программирования корявость останется корявостью. Невозможно научить машину понимать смысл. Так оно и будет, еще n-ное количество лет.

(Ответить) (Ветвь дискуссии)


[info]werdender@lj
2010-07-13 01:11 (ссылка)
То же относится и к машинному переводу.

(Ответить) (Уровень выше)


[info]vlkamov@lj
2010-07-13 01:44 (ссылка)
> Невозможно научить машину понимать смысл.

http://ivanov-petrov.livejournal.com/1463973.html?thread=71779493#t71779493

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]werdender@lj
2010-07-13 01:56 (ссылка)
Даже если появится заказчик, все чего удастся добиться – снижение уровня корявости. Человеконеотличимых изложений все равно не будет.
Дело в качественном отличии «разума» машины от разума человека.
Есть эксперимент (http://dirty.ru/comments/280893) с шимпанзе Коко, где ее научили общаться с помощью языка глухонемых. Всех слов она не знала, тогда она легко импровизировала, например утку назвала «птичка вода». Машина на такую импровизацию будет неспособна. Даже внесение в нее всех существующих словарей положение не исправит.
И не в затратах дело. На создание систем машинного перевода тратятся нехилые деньги, и заказчики есть. Но перевод так и остается машинным.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vlkamov@lj
2010-07-13 02:25 (ссылка)
> Дело в качественном отличии «разума» машины от разума человека.

Квантовые трубочки ?

> Машина на такую импровизацию будет неспособна.
Импровизирующая машина уже лет как -надцать есть. Другое дело что вы об этом не читали.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]werdender@lj
2010-07-13 02:39 (ссылка)
Квантовые трубочки? Ну да, еще еще n-ное количество лет и все возможно будет ок.
Импровизирующая машина? Скорее импровизирующие программисты. Или она сама творческие способности проявила?

Давайте, вообще, уточним. Может мы о разных вещах говорим? Вы всерьез утверждаете, что имея достаточный финансовый ресурс, вы научите машину понимать смысл, используя существующие технологии?

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]vlkamov@lj, 2010-07-13 03:00:02
(без темы) - [info]werdender@lj, 2010-07-13 03:29:32
(без темы) - [info]vlkamov@lj, 2010-07-13 03:43:55
(без темы) - [info]werdender@lj, 2010-07-13 04:03:43
(без темы) - [info]_winnie@lj, 2010-07-13 05:07:30
(без темы) - [info]werdender@lj, 2010-07-13 09:01:18
(без темы) - [info]malchikk@lj, 2010-07-15 12:09:13
(без темы) - [info]vlkamov@lj, 2010-07-15 22:59:24
(без темы) - [info]malchikk@lj, 2010-07-16 04:58:44
(без темы) - [info]vlkamov@lj, 2010-07-16 05:38:58
(без темы) - [info]malchikk@lj, 2010-07-16 06:18:34
(без темы) - [info]vlkamov@lj, 2010-07-16 07:11:25
(без темы) - [info]malchikk@lj, 2010-07-16 13:26:58
(без темы) - [info]vlkamov@lj, 2010-07-16 22:51:07
(без темы) - [info]malchikk@lj, 2010-07-17 06:26:00
(без темы) - [info]vlkamov@lj, 2010-07-17 07:52:10
(без темы) - [info]malchikk@lj, 2010-07-17 08:00:03
(без темы) - [info]vlkamov@lj, 2010-07-17 08:42:28
(без темы) - [info]vlkamov@lj, 2010-07-16 09:19:43

[info]wishfocus@lj
2010-07-13 14:26 (ссылка)
True!

(Ответить) (Уровень выше)


[info]kondybas@lj
2010-07-13 01:17 (ссылка)
Словарный перевод, пусть даже на уровне лексем - механическое преобразование грамматик. А реферирование - это уже семантика, тут нужно вычленять смысл. Чутье мне подсказывает, что этого пока никто не умеет.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 01:58 (ссылка)
раньше так же говорили про перевод. А потом нашлась механическая составляющая. конечно, имеющийся автоперевод невыразимо гадок. Но вдруг там какие прорывы... Вот ниже говорят - дайти, типа, денег, и все будет http://ivanov-petrov.livejournal.com/1463973.html?thread=71779493#t71779493

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kondybas@lj
2010-07-13 06:35 (ссылка)
Да ведь и перевод гадок ровно по той причине, что переводило до семантики не достает. Пока что. А в перспективе - отчего бы и нет? Но сначала появится хорошего качества перевод, а уж затем - приемлемого качества реферирование.

(Ответить) (Уровень выше)


[info]kondybas@lj
2010-07-13 06:50 (ссылка)
Мне смутно чудится некоторая последовательность.

Распознавание текстов упирается в количество букв (пусть и разных начертаний). Букв сравнительно немного, и их переработка случилась первой.

Словарный перевод текстов упирается в толщину словарей, и, как только мощность механизмов превысила толщину словарей, случился машинный словарный перевод.

Для реферирования понадобится оперировать не словарями, а вообще всем текстуальным объемом, пусть не человечества в целом, а только одной отрасли. Чтобы иметь возможность оценить новизну, как минимум. Т.е. я не исключаю, что появится машина, в которую можно будет запихнуть рукопись, а на выходе получить "гениальный прорыв с необычным взглядом на основы" или "херня" - ну, как повезет :)

(Ответить) (Уровень выше)


[info]sigurna@lj
2010-07-13 06:50 (ссылка)
вас обманывает чутье: http://www.dialog-21.ru/
семантика - самое основное направление работ, что лингвистов, что ИИ-шников

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kondybas@lj
2010-07-13 07:05 (ссылка)
Кто бы сомневался, что основное. Вопрос лишь в том, где работы, а где - семантика. В частности, семантика слова "умеет".

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sigurna@lj
2010-07-13 07:08 (ссылка)
а вы почитайте материалы "Диалога". Там много удивительного найдете

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kondybas@lj
2010-07-13 07:22 (ссылка)
Я бы предпочел увидеть реферирующую машину ;) Потому что технологии полета на крыльях из перьев, склеенных воском, описаны уже тысячи лет назад. Вот только летать начали сравнительно недавно и - кхгм! - немножко не так :)

По плодам узнается древо, нет машины - нет умения. А раз нет ножек - нет и мультиков.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]sigurna@lj, 2010-07-13 07:24:59
(без темы) - [info]kondybas@lj, 2010-07-13 07:29:46

[info]vlkamov@lj
2010-07-13 01:42 (ссылка)
> У меня вопрос. Есть ли разработки в этом направлении?

Таких вопросов "легион". Буквально на прошлой неделе обсуждали вычислительные методы метеорологии и один товарищ пожаловался, что нет разработок более адекватных, чем ныне используемые. Cейчас вот про пересказ.

Правильная формулировка - есть ли заказчик ?

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 01:56 (ссылка)
То есть был бы заказчик - будет компьютерный пересказ?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vlkamov@lj
2010-07-13 02:26 (ссылка)
Да.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 04:02 (ссылка)
а как бы это могло выглядеть? я не собираюсь спрашивать о смысле и непереводимости. Я спрашиваю о вещи вполне практической, оставляя в стороне иронию и подтексты. Имеется набор документов, научных статей - там ирония редка - и хочется иметь краткие пересказы, чтобы было из небольшого текста понятно, о чем речь в полном тексте. При этом просто сгребание в кучу частотных слов, терминов - не годится, поскольку вопрос не "Можно ли выдрессировать человека находить в бессмысленной куче слов какие-то указания", а именно "машинное реферирование" - речь о работе машины, а не дрессировке читателя.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]werdender@lj
2010-07-13 04:15 (ссылка)
Как часто в научных статьях встречаются новые слова, термины? Если допустить возможность человеческой правки результата, то такое возможно. Иначе однозначно нет (сейчас). Повышение «человекоподобности» однозначно возможно. Результат будет напоминать результаты работы научных журналистов.

*простите что влез.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]ivanov_petrov@lj, 2010-07-13 04:24:12
(без темы) - [info]werdender@lj, 2010-07-13 08:48:57

[info]vlkamov@lj
2010-07-13 04:43 (ссылка)
Постановка задачи - тоже немалый труд ;-)

А вот так, впопыхах, можно отметить следующее.
1) Строгой теории пересказа не существует, приблизительной тоже. Есть только куча примеров в разной степени и разными "экспертами" признаваемая пересказами. Следовательно - не кодирование, а обучение.
2) Обучаемые программы давно известны - нейронные сети.
3) Абсолюта не будет никогда в том числе и потому, что единого мнения даже по обучающей выборке (см.п.1) нет. 95% машинного продукта будут признаны "пересказами" 95% экспертов - как-то так.

В подопечной конторе переход на новую программную систему и часть информации бухгалтеру пришлось вводить без контроля. Потом конечно проверили, так из шестисот кодов (4-хзначные числа), расположенных в фиксированном месте платежного документа и выделенных шрифтом два были несуществующими (перепутанные еще не ловили). От машины же почему-то принято требовать безошибочного результата.

(Ответить) (Уровень выше)


[info]eldhenn@lj
2010-07-13 05:21 (ссылка)
>хочется иметь краткие пересказы, чтобы было из небольшого текста понятно, о чем речь в полном тексте

Я вдруг подумал - а вы правильно ставите задачу? Если научную статью сократить вдвое, и по краткому тексту можно будет понять о чём статья - зачем нужна вторая половина?

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]ivanov_petrov@lj, 2010-07-13 05:24:56
Ещё раз. - [info]eldhenn@lj, 2010-07-13 05:28:28
Re: Ещё раз. - [info]ivanov_petrov@lj, 2010-07-13 05:36:27
Re: Ещё раз. - [info]eldhenn@lj, 2010-07-13 05:45:38
Re: Ещё раз. - [info]ivanov_petrov@lj, 2010-07-13 05:57:08
Re: Ещё раз. - [info]eldhenn@lj, 2010-07-13 06:14:55
Re: Ещё раз. - [info]ivanov_petrov@lj, 2010-07-13 06:18:33
(без темы) - [info]eldhenn@lj, 2010-07-13 05:30:17

[info]sigurna@lj
2010-07-13 06:58 (ссылка)
нет, частотный анализ для этой задачи не используется.
используется: построение семантической сети текста; наложение на семсеть онтологии (желательно той предметной области, которая привязана к основному смыслу текста, но если вычленить таковую не удается (например, текст сам по себе копмилятив статей) - то берется общая онтология).
После этого вычленяется "скелет" сети, который рассматривается как смысловая основа текста.
Опять же, таких скелетов может быть несколько: в тексте говорится о нескольких вещах, между собой смыслово несвязанных.

Далее каждый скелет развертывается в текст (из нормализованной формы приводится в связный текст - падежи, склонения, времена).
Самый сложный кусок - онтологии, инженерия знаний. Как построение онтологии максимально автоматизировать и упростить с т.з. инженера-онтолога. Здесь самые копья щас и ломаются.

Вполне решаемая задача. И с точностью до корявости рук разработчиков решается.
И заказчики есть, и деньги.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]ivanov_petrov@lj, 2010-07-13 07:07:55
(без темы) - [info]sigurna@lj, 2010-07-13 07:14:17
(без темы) - [info]ivanov_petrov@lj, 2010-07-13 07:18:16
(без темы) - [info]sigurna@lj, 2010-07-13 07:23:55

[info]misha_makferson@lj
2010-07-13 04:33 (ссылка)
Да вообще-то заказчики есть и со стороны бизнеса и со стороны кхм государственных органов.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]misha_makferson@lj
2010-07-13 04:35 (ссылка)
То есть поправлюсь может заказчиков и нет или они дают мало денег, но потребность такая вполне осознана.

(Ответить) (Уровень выше)


[info]misha_makferson@lj
2010-07-13 05:08 (ссылка)
>Буквально на прошлой неделе обсуждали вычислительные методы метеорологии и один товарищ пожаловался, что нет разработок более адекватных, чем ныне используемые

Это поэтому метеорология один из крупнейших потребителей высокопроизводительных вычислений? :-)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vlkamov@lj
2010-07-13 05:29 (ссылка)
:-)

(Ответить) (Уровень выше)


[info]vasia712@lj
2010-07-13 03:24 (ссылка)
//Это ведь вопрос об искусственном интеллекте.

Это ведь вопрос об обычном интеллекте и еще образовании. Искусственному до такого вопроса еще три дня лесом, два дня полем.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 04:03 (ссылка)
То есть - совершенно невозможно? Нив каком виде? И не удастся сделать поприличнее системы машинного перевода?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Ни в каком виде
[info]vasia712@lj
2010-07-13 06:12 (ссылка)
Смотря что иметь под словом перевод.

Приличный подстрочник вполне достижим, но вы ведь хотите пересказ, т.е. требуете от машины понимания. А понимание у нее на уровне креветки и то не факт. Когда-нибудь оно конечно будет, лет через 40-50.

(Ответить) (Уровень выше)


[info]sigurna@lj
2010-07-13 07:02 (ссылка)
основная проблема сегодняшних систем перевода - отсутствие базы знаний у робота.
Поэтому перевод механистический, без выделения смысла переводимого текста.
Правильный же переводчик работает не со словарями - а с моделями мира, описанными на разных языках.
Вот модель мира на английском. Вот - на русском.
Задача робота:
1. Найти минимально возможное маппирование с одной онтологии на другую (опираясь на те слова и смысловые конструкты, которые выделены в переводимом тексте)
2. собрать текст из понятий целевой онтологии

Замечу: вся братва, занимающаяся переводчиками, сейчас в рот смотрит системам семантического анализа текстов. А Яндекс даже заслал своих бойцов в Шеффилд учиться:)
Кстати, тот же АББИ вкладывает нехилые деньги в семантик.нетворк

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 07:10 (ссылка)
да. очень рад слышать. мне бы тоже казалось, что надо как-то так двигаться, только я - конечно - не знал, что же происходит на самом деле. Как я догадываюсь - разработка всяких стандартов представления онтологии, прорисовка сетей. Наверное, интересно. А есть какие-то доступно сделанные нескучные обзоры? Лучше по-русски, конечно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sigurna@lj
2010-07-13 07:16 (ссылка)
http://www.dialog-21.ru
http://www.avicomp.ru
http://www.rco.ru

обзоры искать лень, уж извините:)
Но на "Диалоговском" сайте некие обзорные материалы точно были.

(Ответить) (Уровень выше)


[info]balanseeker@lj
2010-07-13 03:36 (ссылка)
Научить машину понимать смыслы можно, нужно только самим людям разобраться - "а что такое "смыслы"? Модели качественной нет. Такую модель могут дать только теоретики разрабатывающие модель человеческой психики. Но в психологии теоретиков такого уровня на сегодня нет...

У меня есть некоторый принципиально новый подход к механизму работы психики. Но нет представления кому его изложить... Психологи находятся в жестких границах своих подходов и парадигм. Программисты очень редко хорошо понимают работу психики.

Рад бы предложить свое видение, но кому?

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 04:04 (ссылка)
что тут сказать. Можно изложить здесь, мне. Можно на страницах Вашего журнала - френдам. Скорее всего, не согласятся = "не поймут", но это уж всегда так. Но прочтут, скорее всего

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]balanseeker@lj
2010-07-13 07:57 (ссылка)
Ну хорошо. Давайте в диалоге попробуем.

Начну с сакраментального вопроса. Что такое эмоции? Зачем они нужны? Почему эмоции по мере развития человеческого интеллекта становяться более разнообразными/сложными?
Попробуйте ответить сначала сами. Достаточно одного абзаца.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 08:01 (ссылка)
Нет, в диалоге не выйдет. Видимо, тут непонимание. Вы сказали - как я понял - "хочу рассказать о своей теории". Я ответил - давайте выслушаю. Но вот затевать многоэтажный диалог - нет, на это я не подписывался. Если нет желания рассказывать - никаких проблем.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]balanseeker@lj
2010-07-13 08:26 (ссылка)
Ок. Реплики необязательны.
Итак, тезис первый:
Эмоций всего две. Положительная и отрицательная. Остальное - интеллектуальная окраска. Зависит от обстоятельств вызвавших эмоцию.

Тезис второй: Есть реальность. Т.е. реальный мир, обстоятельства и отношения существующие объективно.
Есть образ реальности в нашем мозгу. Модель мира.
Модель может быть очень упрощенной как у ребенка и довольно сложной как у зрелого человека.
Ну и, очевидно, "Жизнь богаче схемы", т.е. модель всегда имеет неполноту, применима только в определенных границах.

Тезис третий: Положительная эмоция возникает тогда, когда модель мира подтверждается на практике.
Отрицательная, когда модель мира входит в противоречие с реальностью. Когнитивный диссонанс.

Итак, психика - система с обратной связью. Получаем комфорт если модель мира получает подтверждение, получаем дискомфорт, если модель мира не может описать реальность.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]ivanov_petrov@lj, 2010-07-13 08:37:25
(без темы) - [info]balanseeker@lj, 2010-07-13 09:17:23
(без темы) - [info]ivanov_petrov@lj, 2010-07-13 09:29:48
(без темы) - [info]balanseeker@lj, 2010-07-13 09:39:01
(без темы) - [info]ivanov_petrov@lj, 2010-07-13 09:43:10
(без темы) - [info]balanseeker@lj, 2010-07-13 09:49:08
(без темы) - [info]ivanov_petrov@lj, 2010-07-13 09:51:06
(без темы) - [info]balanseeker@lj, 2010-07-13 10:03:45
(без темы) - [info]ivanov_petrov@lj, 2010-07-13 10:25:19
(без темы) - [info]balanseeker@lj, 2010-07-13 10:45:51
(без темы) - [info]ivanov_petrov@lj, 2010-07-13 11:19:24
(без темы) - [info]balanseeker@lj, 2010-07-13 10:05:19
(без темы) - [info]ivanov_petrov@lj, 2010-07-13 10:26:31
(без темы) - [info]balanseeker@lj, 2010-07-13 10:01:56
(без темы) - [info]balanseeker@lj, 2010-07-13 09:40:43

[info]balanseeker@lj
2010-07-13 08:30 (ссылка)
Более детально смотрим здесь:

http://www.scorcher.ru/neuro/conceptions/zaharov/zaharov.php
Но тут только предпосылки для следующего логического хода.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]ivanov_petrov@lj, 2010-07-13 08:38:32

[info]balanseeker@lj
2010-07-13 09:09 (ссылка)
Тезис четвертый: Человеческий язык удобен в качестве знаков (указателей), указывающих на отдельные части модели мира, "наклеек" на умственные конструкции, но неудобен для описания собственно моделей. Т.е. наш мозг хранит модель мира в какой-то форме имеющей несловесный характер.

Это легко понять, наблюдая как мы доносим до школьников планетарную модель Солнечной системы.
Модель орбит из проволоки и шариков-планет объяснит устройство гораздо лучше, чем словесное описание.

Таким образом, решая задачу искусственного интеллекта, первое что мы должны сделать, это создать конструктор позволяющий описывать любые модели: статические, динамические, многомерные. Словесный язык, для этого не подходит.

(Ответить) (Уровень выше)


[info]balanseeker@lj
2010-07-13 11:27 (ссылка)
Тезис пятый: Психика работает как некий механизм, который требует регулярного подтверждения модели мира. Т.е. психика ИНИЦИАТИВНО тестирует окружающую действительность на предмет соответствия/несоответствия модели мира. Тестирование как правило касается некой небольшой, частной области этой модели. Те области модели которые не тестируются находятся на периферии интересов, и могут иметь сильное рассогласование с реальностью, однако это не приводит к явному когнитивному диссонансу до момента когда случай не заставит протестировать и эти области модели мира.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]ivanov_petrov@lj, 2010-07-13 11:29:43
(без темы) - [info]balanseeker@lj, 2010-07-14 07:23:04

[info]balanseeker@lj
2010-07-13 11:48 (ссылка)
Тезис шестой:
Психика затрачивает усилия на поддержание внутренней непротиворечивости модели мира.
Если человек на протяжении своего взросления сформировал достаточно адекватную модель мира, то на эти усилия затрачивается не слишком много ресурсов мозга.
Если человеку не хватило интеллекта составить более-менее качественную/адекватную модель мира, то усилия психики по поддержанию внутренней непротиворечивости могут натолкнуться на принципиально неразрешимые противоречия. Это может быть первопричиной многих психических проблем. В частности шизофрения характеризуется состоянием "разделенного сознания", т.е. одна область модели мира несовмещается с другой.

Наоборот, религиозный, верующий человек, за счет внесения концепта Бога в модель мира допускает простые объяснения для сложных вещей, уменьшая тем самым потребность в снятии внутренних противоречий. Достигается психотерапевтический эффект.

(Ответить) (Уровень выше)


[info]balanseeker@lj
2010-07-13 12:09 (ссылка)
Тезис седьмой:
Интеллект - это качество состоящее из нескольких компонент:
1. способность изобретать/конструировать/перенимать частные области (модели мира) и вписывать их в существующую модель мира
2. способность рационально осмыслить рассогласование модели с действительностью
3. способность рационально осмыслить внутренние противоречия в модели мира
4. способность выбрать наиболее адекватную частную область модели для описания некоторой конкретной реальности, выбрать правильный контекст

(Ответить) (Уровень выше)


[info]balanseeker@lj
2010-07-13 12:26 (ссылка)
Тезис восьмой:
Существует 2 способа адаптации к действительности.
Активный - модель мира диктует как должно быть, человек пытается изменить реальность.
Примеры: "болеть - плохо" - ищем способ лечения, "эксплуатация - плохо" - строим общество без эксплуатации, "рисовать Магомета - плохо" - убиваем художников рисующих Магомета
Пассивный - модель мира несовершенна, человек меняет модель мира
Примеры: "болеть - плохо" - "надо поменьше думать о болячках, само пройдет",
"эксплуатация - плохо" - "все друг друга эксплуатируют, это нормально",
"рисовать Магомета - плохо" - "на все воля Аллаха, за свои грехи каждому придется расплачиваться"

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]balanseeker@lj, 2010-07-13 12:37:32
(без темы) - [info]balanseeker@lj, 2010-07-14 05:48:17

[info]balanseeker@lj
2010-07-16 01:40 (ссылка)
Странно, что проявив сначала интерес, Вы как то замолкли...
Неинтересно? Банально? Или подкормились идеями и дальше пошли?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-16 01:46 (ссылка)
Я не специалист в этой области и наверняка не могу увидеть многих важных деталей. Общий настрой теории мне знаком - я сказал, каких авторов напоминает, там примерно та же редукция, некоторые детали рассуждений буквально повторяют то, к чему пришел Амосов. Думаю, это не случайно - у вас были общие мотивы, некоторое презрение к психологам, которые не говорят внятно, и попытка сделать технически-ясное изложение. Хотя, наверное, отличия найдутся, как без этого. Как мне кажется, я понял общую направленность и основные черты теории. На этом самом уровне - что идеи мне давно знакомы, так что не подкормился... а вспомнил.

Мне кажется, это вызывает у Вас раздражение? Пожалуйста, не сердитесь. Я готов поверить, что Вам эта теория представляется чрезвычайно важной, открывающей глаза и пр. и не собираюсь с этим спорить. На мой взгляд, Вы в краткой и ясной форме переизлагаете старые мысли, известные минимум больше полувека - но это ничем не плохо.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]balanseeker@lj
2010-07-16 02:13 (ссылка)
Да я не трясусь над своими идеями. Мне нужен критичный собеседник, чтобы увидеть слабые или не проработанные стороны. К сожалению, письменно излагаемые мной тезисы выглядят бедно, нужно иллюстрировать их живыми примерами, из жизни. Лучше всего это происходит в живом разговоре...

Плюс к этому мне кажется, что современная разработка ИИ сводится к работе с языковыми конструкциями, что на мой взгляд - тупиковый путь. Реальное распознавание речи - это распознавание смыслов. А смыслы - это проекции частных областей модели мира...
Короче тут много о чем есть поговорить.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]ivanov_petrov@lj, 2010-07-16 02:25:40
(без темы) - [info]balanseeker@lj, 2010-07-16 03:06:04
(без темы) - [info]ivanov_petrov@lj, 2010-07-16 03:07:59
(без темы) - [info]ivanov_petrov@lj, 2010-07-16 03:19:14
(без темы) - [info]balanseeker@lj, 2010-07-16 03:22:11
(без темы) - [info]ivanov_petrov@lj, 2010-07-16 03:53:43
(без темы) - [info]balanseeker@lj, 2010-07-16 05:33:02

[info]misha_makferson@lj
2010-07-13 03:44 (ссылка)
Имею креативное предложение. Надо людям писать по формализованным паттернам приспособленным к машинному разбору и толкованию :-))

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 04:05 (ссылка)
Это понятно. Я совершенно уверен, что людей можно выдрессировать вести себя как придуманный образ искусственного интеллекта. Возможности разума очень велики, и уродовать разум можно очень изощренно. Но я хотел спросить не о нормах изуродования в виде плохих переводов, чудовищных рефератов, идиотских наборов ключевых слов и пр., а - что может сделать машина в этом отношении.

(Ответить) (Уровень выше)


[info]werdender@lj
2010-07-13 04:06 (ссылка)
Да, согласен, если гора не идет к Магомету...
Иначе:

- А, мать вашу сучью, дышлом крещенную… - гремело ему вслед.

В тот момент, когда альдебаранец с трудом разбирал на экране Телепатика первую переведенную фразу существа: «Предок по женской линии четвероногого млекопитающего, подвергнутый действию части четырехколесного экипажа в рамках религиозного обряда, основанного на…» - воздух завыл над его каракатицевидной головой и смертельный удар обрушился на него.

(Ответить) (Уровень выше)

:^)
[info]nil_0@lj
2010-07-13 04:10 (ссылка)
Меня вчера двое зафрендили, у обоих в ЖЖ одна запись ТОЖДЕСТВЕННАЯ с точностью до замены слов на синонимы. Явно кто-то компьютерным пересказом балуется.

(Ответить) (Ветвь дискуссии)

Re: :^)
[info]ivanov_petrov@lj
2010-07-13 04:11 (ссылка)
ну, использовать-то можно по-разному. Ясно, что всякие спам-боты будут использовать - если будет работать.

(Ответить) (Уровень выше)

Ну и тривиальное замечание
[info]misha_makferson@lj
2010-07-13 04:46 (ссылка)
Если речь о тексте вообще то задача видимо неразрешима в принципе. Пересказать Кафку или там Джойса какого и люди то не все могут.
Мы ведь некое подмножество обсуждаем? А именно реферирование научных и\или технических текстов.

(Ответить) (Ветвь дискуссии)

Re: Ну и тривиальное замечание
[info]ivanov_petrov@lj
2010-07-13 04:53 (ссылка)
я сегодня готов быть добрым. Не надо Джойса. Научные статьи и документы. В сторону вторые смыслы, иронию и прочий нарративный нелегал. Вот, к примеру, новостной робот Яндекса делает что-то этакое с новостями - хотя б в сюжеты их соединяет. Может быть, в этом направлении можно двинуться.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Ну и тривиальное замечание
[info]eldhenn@lj
2010-07-13 05:15 (ссылка)
А может действительно - формализовать, стандартизировать написание статей и документов? И создавать их не полностью самостоятельно, а с помощью специального софта, который будет как-то заставлять поток мысли укладываться стройными рядами. И наступит светлое будущее - научные статьи в XML. А там, глядишь, потихоньку и до Вильяма нашего Шекспира доберёмся...

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Ну и тривиальное замечание
[info]ivanov_petrov@lj
2010-07-13 05:22 (ссылка)
зачем тогда пересказ? Изменить мышление людей можно. Оно и так, прямо скажем, говенное - люди в большинстве в мыслительном плане... Гхм. Так вот, сделать хуже - не проблема. Но зачем? Вам кажется, что вокруг все слишком умные?

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Ну и тривиальное замечание - [info]eldhenn@lj, 2010-07-13 05:32:02
Re: Ну и тривиальное замечание - [info]misha_makferson@lj, 2010-07-13 05:42:30
Re: Ну и тривиальное замечание - [info]eldhenn@lj, 2010-07-13 05:47:16
Re: Ну и тривиальное замечание - [info]misha_makferson@lj, 2010-07-13 06:31:24
Re: Ну и тривиальное замечание
[info]eldhenn@lj
2010-07-13 05:18 (ссылка)
Статьи и документы они ведь уже частично формализованы. У статьи обязательно ... ну как правило есть структура какая-то, есть хорошие правила оформления - там количество и плотность иллюстраций, пояснения к этим иллюстрациям, введение, раскрытие мысли, заключение...

(Ответить) (Уровень выше)


[info]zh3l@lj
2010-07-13 04:49 (ссылка)
Image (http://picasaweb.google.de/lh/photo/6jmOyU8CNRxWVi1oTqzBUA?feat=embedwebsite)Von Zeichnungen (http://picasaweb.google.de/JuraRom/Zeichnungen?feat=embedwebsite)

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 04:56 (ссылка)
Сопоставил фигуры ноутбука и мыслителя. понял, где у мыслителя должен открываться экран и где - клавиатура. Ну что же, вполне себе дизайнерское решение. Разложил мыслителя - и набирай.

(Ответить) (Уровень выше)

(Комментарий удалён)

[info]misha_makferson@lj
2010-07-13 05:17 (ссылка)
Ну да. В ограниченной предметной области это может сработать.
Правда духи Сепира и Уорфа порезвятся на предмет того как изменяется сознание (представление о мире) человека излагающего смысл таким формализованным языком. :-)

(Ответить) (Уровень выше)

Раздается жуткий свист — Это вышел в Подпространство
[info]_winnie@lj
2010-07-13 05:10 (ссылка)
Не совсем по этой теме, по более общей. Хорошая популярная статья в «Русском Репортере» - http://www.rusrep.ru/2010/24/mashinnyi_perevod/

(Ответить) (Ветвь дискуссии)

Re: Раздается жуткий свист — Это вышел в Подпространств
[info]ivanov_petrov@lj
2010-07-13 05:16 (ссылка)
"Эволюция машинного перевода — история того, как идея, казавшаяся поначалу очень простой, в процессе исполнения превращается в неподъемную задачу. "
"Окончательно добила первые переводчики так называемая Черная книга машинного перевода — опубликованный в 1966 году доклад Комитета по прикладной лингвистике Национальной академии наук США. Группа экспертов констатировала принципиальную невозможность машинного перевода и советовала работы в этом направлении прикрыть. Что и было сделано. "

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Раздается жуткий свист — Это вышел в Подпространств
[info]_winnie@lj
2010-07-13 05:20 (ссылка)
>Группа экспертов констатировала принципиальную невозможность машинного перевода
Тогда не было быстрых компьютеров, огромных массивов текста в электронном виде, лингвистика была моложе, а теория алгоритмов - сильно моложе.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Раздается жуткий свист — Это вышел в Подпространств
[info]ivanov_petrov@lj
2010-07-13 05:23 (ссылка)
Да. Но переводчики и сейчас - полное дерьмо.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Раздается жуткий свист — Это вышел в Подпространств - [info]sulfid@lj, 2010-07-13 05:48:44
Re: Раздается жуткий свист — Это вышел в Подпространств - [info]ivanov_petrov@lj, 2010-07-13 05:58:08
Re: Раздается жуткий свист — Это вышел в Подпространств - [info]sulfid@lj, 2010-07-13 05:59:35
Re: Раздается жуткий свист — Это вышел в Подпространств - [info]ivanov_petrov@lj, 2010-07-13 06:01:44
Re: Раздается жуткий свист — Это вышел в Подпространств - [info]sulfid@lj, 2010-07-13 06:04:20
Re: Раздается жуткий свист — Это вышел в Подпространств - [info]ivanov_petrov@lj, 2010-07-13 06:07:17
Re: Раздается жуткий свист — Это вышел в Подпространств - [info]sulfid@lj, 2010-07-13 06:09:56
Re: Раздается жуткий свист — Это вышел в Подпространств - [info]rednyrg721@lj, 2010-07-13 07:04:55

[info]diing@lj
2010-07-13 05:11 (ссылка)

однако, думается, робот "пересказа" возможен к реализации в наст время,
если не ставить задачей универсальное его применение, а задаться реализовать его в ограниченной области знания.

Есть подход и с другой стороны: и он реально прорабатывается (например в области проектирования). Он заключается в строгом нормировании самого языка написания текстов. Жесткость терминологии разумеется не допускает в нем "иронию и контекты" - он машинообразен и может быть основой для машинного переложения.

Есть наконец, математика - язык, который описывает объекты и их поведение так, что его "тексты" поддаются машиному анализу на соответствие смыслов и их переложению, - точнее по своей природе является машинным языком.

(Ответить)


[info]sulfid@lj
2010-07-13 05:47 (ссылка)
ну в научных текстах обычно в начале и конце краткое резюме дается, так что зачем бы.
думаю, что для пересказа необходим полноценный ИИ, алгоритмом это не сделаешь.
(тем более, что с подобной задачей далеко не все люди справляются)

(Ответить) (Ветвь дискуссии)


[info]sigurna@lj
2010-07-13 07:07 (ссылка)
О!
А "полноценный ИИ" - это не алгоритм. Ага.
Вас не затруднит привести неалгоритмизируемой задачи?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sulfid@lj
2010-07-13 15:18 (ссылка)
гипотетически и формально можно конечно все что угодно алгоритмизировать.
однако в реальности любая творческая задача (тот же перевод) требует личности, отношения - а личность даже если и алгоритм, то весьма далекий для современной науки

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sigurna@lj
2010-07-13 15:20 (ссылка)
понятно.
Темой не владеете.

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]sulfid@lj, 2010-07-13 15:29:12
(без темы) - [info]vlkamov@lj, 2010-07-14 00:21:15
(без темы) - [info]vlkamov@lj, 2010-07-14 00:23:01
(без темы) - [info]sulfid@lj, 2010-07-14 04:23:13
(без темы) - [info]sulfid@lj, 2010-07-14 04:20:52
(без темы) - [info]vlkamov@lj, 2010-07-14 04:40:17
(без темы) - [info]sulfid@lj, 2010-07-14 04:45:02
(без темы) - [info]vlkamov@lj, 2010-07-14 06:51:37
(без темы) - [info]sulfid@lj, 2010-07-14 07:04:17
(без темы) - [info]vlkamov@lj, 2010-07-14 07:13:22
(без темы) - [info]sulfid@lj, 2010-07-14 18:00:16

[info]vlkamov@lj
2010-07-14 00:20 (ссылка)
> Вас не затруднит привести неалгоритмизируемой задачи?

Интеллект [info]sulfid@lj

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]sigurna@lj
2010-07-14 03:21 (ссылка)
Ээээ... Если быть точным - это не задача, а процесс.
Но это так, от растерянности.
А вообще - да, уели. Пример зачетный:)

(Ответить) (Уровень выше) (Ветвь дискуссии)

(без темы) - [info]sulfid@lj, 2010-07-14 04:28:52

[info]sulfid@lj
2010-07-14 04:35 (ссылка)
я как раз искусственный, это плохой пример

(Ответить) (Уровень выше)


[info]pfiksman@lj
2010-07-13 08:29 (ссылка)
вообще, ведущим специалистом в этой области считается Freddy Choi, в его диссертации можно найти ссылки как раз на алгоритмы "пересказа" текстов, но универсального подхода в наше время конечно еще нет.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2010-07-13 08:35 (ссылка)
спасибо

(Ответить) (Уровень выше)