Denis Mironov
mironovd
.. :.::.

Links

October 2022
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31

Back December 16th, 2005 Forward
Denis Mironov [userpic]

"Модели для сборки".

Помните, было где-то описано, как придать автомату, играющему в покер "характер". Если нет, то вкратце это выгладит так: рассмотрим весовую функцию оценки эффективности партий. Если она линейна (производная константа), то получается автомат адекватно и оптимально оценивающий свои ходы. Если ее производная монотонно убывает, то мы имеем "бедняка, который радуется любому, даже очень малому, выигрышу и так же переживает по поводу любого проигрыша". При возрастании производной можно наблюдать обратный эффект - почти проигрыши и выигрыши оцениваются довольно вяло - пере нами "сорящий деньгами богач". И наконец, взяв в качестве производной дельта-функцию, получим игрока, для которого жизненно важно выиграть не меньше определенной суммы.

А теперь, собственно, более новая модель.
1. Рассмотрим систему обработки данных (экспертную): есть набор данных, полагающийся известным и абсолютно точным. Система делает предсказания на основе имеющихся данных относительно некоторой величины в будущем. Каждый раз, когда прогноз проверяется, системе дают реальный результат для внутренней корректировки. Система имеет внутреннее состояние, на которое управляющий может оказывать влияние только через "подтверждения прогнозов" и никак иначе. Системой может быть, например, нейронная сеть. Такие системы реально используются, например для предсказаний котировок ценных бумаг. А вот остальные примеры пока не реализованы.
2. Теперь предположим, что система способна получать подтверждения своим прогнозам только изредка (вероятность получения тоже может зависеть от состояния системы). Можно так же предположить, что в систему внесена возможность выводить логические следствия из собственных прогнозов (и получать подтверждения не только на прогнозы, но и на следствия [или только на следствия]). Данная система будет некоторым, крайне грубым способом моделировать процесс работы теоретика, строящего теорию для описания некоторого явления и лишь изредка получающего экспериментальные подтверждения/опровержения. Предполагаю, что картина ее работы будет полна флуктуаций и случайных блужданий. Уточню, что в данной модели система считает подтверждения абсолютно истинными.
3. Введем еще один параметр в состояние системы - "доверие наблюдаемым данным". Система может в некоторых ситуациях отклонить результаты внешнего подтверждения и не изменить собственного состояния, не отклонить прогноз. Делать она это будет в зависимости от внутреннего "индекса доверия" (зависимость, скорее всего следует делать нелинейной). Возможно, подбором начальных условий можно сделать так, чтобы этот параметр стал нулевым (абсолютное недоверие). Этот крайний случай "систем с доверием" я назову "солипсист/религиозный фанатик". Интересно описание процесса, при котором почти нулевой "индекс доверия" можно снова сделать значительным.

Denis Mironov [userpic]

"Модели для сборки".

Помните, было где-то описано, как придать автомату, играющему в покер "характер". Если нет, то вкратце это выгладит так: рассмотрим весовую функцию оценки эффективности партий. Если она линейна (производная константа), то получается автомат адекватно и оптимально оценивающий свои ходы. Если ее производная монотонно убывает, то мы имеем "бедняка, который радуется любому, даже очень малому, выигрышу и так же переживает по поводу любого проигрыша". При возрастании производной можно наблюдать обратный эффект - почти проигрыши и выигрыши оцениваются довольно вяло - пере нами "сорящий деньгами богач". И наконец, взяв в качестве производной дельта-функцию, получим игрока, для которого жизненно важно выиграть не меньше определенной суммы.

А теперь, собственно, более новая модель.
1. Рассмотрим систему обработки данных (экспертную): есть набор данных, полагающийся известным и абсолютно точным. Система делает предсказания на основе имеющихся данных относительно некоторой величины в будущем. Каждый раз, когда прогноз проверяется, системе дают реальный результат для внутренней корректировки. Система имеет внутреннее состояние, на которое управляющий может оказывать влияние только через "подтверждения прогнозов" и никак иначе. Системой может быть, например, нейронная сеть. Такие системы реально используются, например для предсказаний котировок ценных бумаг. А вот остальные примеры пока не реализованы.
2. Теперь предположим, что система способна получать подтверждения своим прогнозам только изредка (вероятность получения тоже может зависеть от состояния системы). Можно так же предположить, что в систему внесена возможность выводить логические следствия из собственных прогнозов (и получать подтверждения не только на прогнозы, но и на следствия [или только на следствия]). Данная система будет некоторым, крайне грубым способом моделировать процесс работы теоретика, строящего теорию для описания некоторого явления и лишь изредка получающего экспериментальные подтверждения/опровержения. Предполагаю, что картина ее работы будет полна флуктуаций и случайных блужданий. Уточню, что в данной модели система считает подтверждения абсолютно истинными.
3. Введем еще один параметр в состояние системы - "доверие наблюдаемым данным". Система может в некоторых ситуациях отклонить результаты внешнего подтверждения и не изменить собственного состояния, не отклонить прогноз. Делать она это будет в зависимости от внутреннего "индекса доверия" (зависимость, скорее всего следует делать нелинейной). Возможно, подбором начальных условий можно сделать так, чтобы этот параметр стал нулевым (абсолютное недоверие). Этот крайний случай "систем с доверием" я назову "солипсист/религиозный фанатик". Интересно описание процесса, при котором почти нулевой "индекс доверия" можно снова сделать значительным.

Back December 16th, 2005 Forward