Приведи в порядок свою планету - [entries|archive|friends|userinfo]
arvegger

[ website | My Website ]
[ userinfo | ljr userinfo ]
[ archive | journal archive ]

[Nov. 19th, 2005|07:36 am]
Previous Entry Add to Memories Tell A Friend Next Entry
LinkLeave a comment

Comments:
[User Picture]
From:[info]erdferkel
Date:November 20th, 2005 - 06:35 pm
(Link)
Ох. Ну, считайте, что из исследовательского любопытства. Проклассифицировал, посмотрел на дальнейшее поведение, посмотрел, что не сходится, уточнил классификацию. И т.д., пока не надоест.
[User Picture]
From:[info]kouzdra
Date:November 20th, 2005 - 06:46 pm
(Link)
Я, честно говоря, не вижу никакого самодостаточного "исследовательского смысла" в классификации чего-либо. Мне более интерсно построение модели, обладающей предсказывающими возможностями. Но тут классификации в большинстве случаев вредны. Я к чему сжатие информации вспоминал - там "информация" - это (несколько упрощенно) просто поток битиков, генерируемым каким-то черным ящиком. А алгоритмы сжатия строят как раз статистическую модель (вот прямо так и называется), которая и используется для более компактного представления.

Один из главных принципов - ни в коем случае не пытаться подстраивать алгоритмы под конкретный "содержательный" смысл информации. "общие" методы работают лучше. Типы источников есть разные - в этом смысле действительно имеет место классификация, но смысл ее исключительно в том, что одни алгоритмы лучше работают с одним типом, другие - с другими.

А Ваш подход мне напоминает усиленные попытки придумать какие "слова" запихнуть в словарь упаковщика. Это не работает почти никогда.

Можно подстроиться под обхий характер сигнала (скажем сжатие mp3 или картинкок делаются по другому, нежели текстов и двоичных данных, но углубляться в подробности - крайне вредно). И то - половина смысла mp3 и jpeg состоит в том, что и там и там - потеря части информации приемлемая цена за улучшение компрессии и от смысла сигнала зависит то, чем именно можно пренебречь.
[User Picture]
From:[info]erdferkel
Date:November 20th, 2005 - 07:39 pm
(Link)
Ну, значит, тут я Вас правильно понял. И соответственно ответил - метафора нехорошая, не бывает в жизни такого, чтобы информация была "до" (отдельно от) "алгоритмов сжатия" и порождаемых ими "статистических моделей". "Чистые данные опыта" - это позитивистская выдумка.

Другое дело - что иногда информация начинает приходить такая, что в рамках существующих алгоритмов работы с нею (каковая работа, повторяю, неотделима от самого процесса принятия информации) получается полная херня. Тогда надо менять алгоритм.

(То есть я при этом считаю, в отличие от многих, что так можно "приблизиться к истине", - иначе говоря, что "алгоритмы" не чисто субъективны, - но это даже можно пока отставить в сторону.)

Ну вот, Вы пока что не заставили меня коренным образом пересмотреть какие-то мои общие представления. Продолжаю работать с прежними. А предсказывать людей, конечно, трудно, они сложные, чтобы хоть что-то получилось - надо долго всматриваться.