Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет flaass ([info]flaass)
@ 2007-04-07 21:56:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
ИИ - II
А будет это так.
Движок: гибрид Юникса и гугловского индексатора. Сам по себе безмозглый, но ассоциативные пласты запускает быстро и экономно; так что даже без глубокого железного параллелизма, на ублюдочном 6-м Пентиуме, все работает не очень медленно.
Пластователь и вербализатор (ввод-вывод). Тут нужен какой-никакой, но разборщик естественного языка. Впрочем, возможны варианты: если все остальное уже достаточно развито, то оно сможет понимать само по себе, как мы улавливаем смысл фраз на малознакомом языке, цепляясь за отдельные слова и за контекст. Вербализатор можно поначалу настроить на какой-нибудь дурацкий пиджин; лишь бы собеседник-человек понимал. Потом, конечно, будут и гекзаметры, и точные рифмы, и любой язык на выбор: если проект пойдет, то на его основе всякие мелкие приложения будут делаться очень дешево.
Ну, и основное содержание: в оперативной памяти тысяч 30 активных пластов, каждый размером под 100К - в 40 гигах им будет просторно. Память - еще десяток-другой гигов частично отпластованных текстов, подгружаемых по необходимости.
Видимо, нужен аналог сознания: наблюдающий модуль, чтобы посылать в вербализатор готовые ассоциативные комплексы.
Во время отладки мы многое узнаем о психических заболеваниях: нежелательные положительные и отрицательные обратные связи, которые, если не глушить, все зацикливают или подвешивают.

Дело за спецификацией объекта "ассоциативный пласт".


(Добавить комментарий)


[info]krotty@lj
2007-04-07 13:11 (ссылка)
video (http://video.google.com/videoplay?docid=4572207081038401578) and slides (http://r.ucsd.edu/IBM%20Almaden%20Institute%20May%2006%20Talk%20Reprise.pdf) of how thinkingconfabulation in humans might work.
Another implementation (http://www.numenta.com/for-developers/education/general-overview-htm.php)

(Ответить)


[info]akopyan@lj
2007-04-07 13:42 (ссылка)
офтоп. Вы в Майком летите? Если да, не могли бы взять с собой оттиск Вашей статьи про прямоугольники?

(Ответить) (Ветвь дискуссии)


[info]flaass@lj
2007-04-08 01:42 (ссылка)
Лечу, прихвачу. Это "Covering boxes by points" с Косточкой?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]akopyan@lj
2007-04-08 02:29 (ссылка)
Да. Спасибо.

(Ответить) (Уровень выше)


(Анонимно)
2007-04-07 13:48 (ссылка)
1. Не вы ли сами когда-то откопали шутника-ученого, который сделал программу имитации "научных" статей в гуманитарных дисциплинах?
Шутник послал их в журналы и парочку приняли; у него была страничка, где можно было к своему удовольствию сделать экземпляр on-line.

2. Я в свое время, с год назад, посмотрел, что модно и что делается в этой области в лабораториях HP, IBM, да и просто в публикациях через arXive или как там его принято писать, открытый склад статей.
Сегодня одно из самых разрабатываемых и модных направлений - анализ блогов, веб-страниц для выделения из них тем/смыслов и кластеризации их с подобными для полностью автоматического слежения за в первую очередь блогосферой.

Самых очевидных применений, как я вижу, два: (а) корпоративное желание впаривать рекламу и т.е., коммерческий фронт и (б) желание полной автоматической слежки

Например, в одной из корпораций устроили p2p систему, которая автоматически определяла из заметок работника его "области экспертизы", и далее если работник компании задавал вопрос, этот автоматический разум по сетке переправлял его вопрос в первую очередь тем, кто числился как владеющий автоматически определенной темой.
Работникам в целом понравилось, но их беспокоило то, что система песочила их заметки без их спроса и, короче, была Большим Братом.

3. Итак, автоматическое выделение смысла уже есть, генератор псевдо-речевок, очень правдоподобных есть, и (только вчера читал у математика, занимающегося сетями) уже осознали, что Искусственный Интеллект - это не нечто новое, что надо еще строить - это живущий собственной жизнью и создаваемый миллионами разумных муравьев ИНТЕРНЕТ (и его подсистемы - Веб, p2p сетки и т.е.), который таким образом надо лишь верно использовать.

Интересно, что лингвистический анализ для выделения нужного, обнаружения подобного и генерации подобного иногда оказывается простым или даже не нужным.
Например, лучший известный мне алгоритм для поиска текстов подобных понравившемуся через поисковик, например, Гугла, вообще не разбирает текст на лингвистические кусочки.
Я прогоняю текст через наипримитивнейший скрипт, который дает мне ряд неочевидных, не совпадающих с теми, что я выбрал бы головой, "ключевых слов", поиск по которым даст мне наиболее подобные исходному образцу тексты.
Лучше всего работает с "серьезными" текстами.

(Ответить) (Ветвь дискуссии)


(Анонимно)
2007-04-07 14:39 (ссылка)
Тут есть большая граница между "ИИ сам 'понимает' что он делает" и "ИИ (=Интернет Интеллект) есть усиление человеческих возможностей", вроде того, как отвертка или нож усиливают возможности кисти, но бесполезны без человека.


Второе есть реальность сегодня, и степени усложнения операций этого "интеллекта", рабоающего в продолжение человеческого, возможны в огромном диапазоне:
(а) в интерактивном режиме
(б) для автоматизации того, что раньше нужно было делать самому

При том даже (б) дает возможность выйти на качественно новый уровень, т.е. сделать то, что раньше было невозможно сделать (как невозможно наняв много счетчиков с логарифмическими линейками заменить компьютерный расчет оптических приборов. Первое делали в Цайсе или в Лайке до войны, создав фотографию портативными камерами. Сегодня объективы рассчитывают иначе)

И первое и второе, по мере понимания особенностей сетевого разума, позволяет открывать новые его функции (как, например, изменило кардинально ряд представлений в биологии, эпидемиологии, и т.д. понимание сетевых "малых миров" с power law distributions).


Так что Искусственный Интеллект не надо конструировать - он уже есть, это Интернет-Интеллект.
Его надо лишь постепенно развивать

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]flaass@lj
2007-04-08 03:36 (ссылка)
> 1. Не вы ли сами когда-то откопали шутника-ученого, который сделал программу имитации "научных" статей в гуманитарных дисциплинах?
Вроде, в журнал он подавал текст, написанный им самим, не продукт программы. И в любом случае, ЕИ или ИИ, если он вещает на постмодернистской мове, я его слушать не буду.

> Искусственный Интеллект не надо конструировать - он уже есть, это Интернет-Интеллект.
Это Человечество-Интеллект, а Интернет лишь интерфейс к нему. Я об этом как-то писал: http://flaass.livejournal.com/256522.html
И в любом случае, конструировать новый надо. Именно потому, что он будет нами сконструирован, а не получен извне. Узнаем больше, применять сможем легче, итп.

(Ответить) (Уровень выше)


[info]avva@lj
2007-04-07 17:05 (ссылка)
Не верю :)

(Ответить) (Ветвь дискуссии)


[info]flaass@lj
2007-04-08 01:46 (ссылка)
Это гораздо лучше, чем "ниасилил" :)

(Ответить) (Уровень выше)


[info]vi_z@lj
2009-08-11 22:26 (ссылка)
Ну да. Спецификация объекта "ассоциативный пласт" -- проблема из геометрии. Все проблемы ИИ -- построение подходящих отображений. Например, проблема перевода -- это задача описания двух отображений: язык1 -> описание_вселенной -> язык2. В ИИ сегодня лучше всего умеют работать, когда пространства моделируются как R^n, а отображения линейные (например, классификация лиц). "Отклонения" от этой линейности вроде искусственных нейронных сетей не масштабируются на что-либо интересно-большое, что говорит о том, что множество отображений выбрано неверно. Другими словами, геометрия пространств таких отображений не ясна. Но и даже эти "отклонения" используют R^n в качестве пространств, куда никак не вписываются многие интересные объекты, вроде предложений естественного языка. Что опять же говорит о непонимании геометрии и попытке засунуть невпихуемое в неподходящий, хотя и хорошо разработанный физиками, инструментарий.

(Ответить) (Ветвь дискуссии)


[info]flaass@lj
2009-08-12 04:17 (ссылка)
Просто в R^n линейные отображения - это можно не думать, а трясти. Под фонарем ищут.
А на самом деле никакой на хрен линейности, сплошные графы и нп-полные задачи. Для эффективности нужно уметь делать настоящий параллелизм, а не эти дурацкие семафоры. А для этого нужно отказаться от идеи, что всякий процесс имеет цель, которая обязана быть достигнута, и что эффективность измеряется по степени достижения заранее указанной цели.
Это я так, все в кучу, бессвязно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]vi_z@lj
2009-08-12 04:36 (ссылка)
Просто в R^n линейные отображения - это можно не думать, а трясти. Под фонарем ищут.

Ну да. Но так часто делают не по злобе. А по неграмотности. Как мне теперь кажется, тут все ближе к непрерывной геометрии (отображения какие-то кусочно-непрерывные или кусочно-дифференцируемые, а может и вообще сплошь дифференцируемые), а специалисты получают образование в дискретной математике и теории сложности вычислений. В результате у людей получается представление о возможных пространствах весьма поверностное (те же графы вполне себе вписываются в квазиметрические пространства как частный случай). Дальше R^n никто ничего и не знает. А те, кто знают, обслуживают физиков, которых ничего дальше простых симметрий, которые можно выписать на бумаге вручную, не интересует.

А на самом деле никакой на хрен линейности, сплошные графы и нп-полные задачи.

Линейности глобальнй нет, а вот непрерывность похоже очень даже есть. В том же языке -- масса синонимов и похожих по смыслу предложений. Может даже и локальная линейность есть. Но всяко (боже упаси) не глобальная, как обычно предполагается в первых же строчках. Возможно, и curse of dimensionality -- от попыток представить линейными моделями нелинейные объекты. Пользуются тем, что любое количество точек данных можно как-то линейно упихнуть -- за счет очень большого по n, но бессмысленного R^n.

Для эффективности нужно уметь делать настоящий параллелизм, а не эти дурацкие семафоры.

Мне кажется, что дискурс утонул в рассуждениях о реализациях. Между тем даже на простых вычислительных моделях (машина тьюринга, нет полиномиальных ограничений) непонятно, что делать. Кстати, Вы видели вот это (http://www.amazon.com/Universal-Artificial-Intelligence-Algorithmic-Probability/dp/3540221395)?
Параллельная реализация -- это вопрос оптимизации по скорости. А пока, на мой взгляд, непонятно, чего оптимизировать.

Это я так, все в кучу, бессвязно.
Ну, хоть как нибудь. Кажется, об этом связно сегодня никто говорить не умеет.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]flaass@lj
2009-08-12 07:14 (ссылка)
Спасибо за ссылку! Книжку я не читал, и вряд ли буду (кажется, спекуляция), но зато впервые узнал, кто такой http://en.wikipedia.org/wiki/Ray_Solomonoff :)

> Параллельная реализация -- это вопрос оптимизации по скорости.
Не только. Это другой способ думания о задаче. Если, конечно, параллелизм настоящий.

Чем отличается И от не-И? Тем, что он _не решает_ задачи, жестко поставленные. Он в процессе работы модифицирует и само условие задачи, и критерии успеха. Потом возможны (и необходимы) подправка условий, уточнение задания и т.д. В общем, нормальный диалог равных собеседников.

А дискретный или непрерывный формализм лучше подходит - мне все же кажется, что дискретный. Но об этом тоже думают многие и разные. Вот там, например, в комментах есть ссылки: http://flaass.livejournal.com/396875.html

(Ответить) (Уровень выше)