Приведи в порядок свою планету -

Приведи в порядок свою планету -

arvegger

[	website	\|	My Website	]
[	userinfo	\|	ljr userinfo	]
[	archive	\|	journal archive	]

	[Nov. 19th, 2005\|07:36 am]

Link	Leave a comment

Comments:

From:	erdferkel
Date:	November 20th, 2005 - 06:35 pm

(Link)

Ох. Ну, считайте, что из исследовательского любопытства. Проклассифицировал, посмотрел на дальнейшее поведение, посмотрел, что не сходится, уточнил классификацию. И т.д., пока не надоест.

(Reply to this) (Parent) (Thread)

From:	kouzdra
Date:	November 20th, 2005 - 06:46 pm

(Link)

Я, честно говоря, не вижу никакого самодостаточного "исследовательского смысла" в классификации чего-либо. Мне более интерсно построение модели, обладающей предсказывающими возможностями. Но тут классификации в большинстве случаев вредны. Я к чему сжатие информации вспоминал - там "информация" - это (несколько упрощенно) просто поток битиков, генерируемым каким-то черным ящиком. А алгоритмы сжатия строят как раз статистическую модель (вот прямо так и называется), которая и используется для более компактного представления.

Один из главных принципов - ни в коем случае не пытаться подстраивать алгоритмы под конкретный "содержательный" смысл информации. "общие" методы работают лучше. Типы источников есть разные - в этом смысле действительно имеет место классификация, но смысл ее исключительно в том, что одни алгоритмы лучше работают с одним типом, другие - с другими.

А Ваш подход мне напоминает усиленные попытки придумать какие "слова" запихнуть в словарь упаковщика. Это не работает почти никогда.

Можно подстроиться под обхий характер сигнала (скажем сжатие mp3 или картинкок делаются по другому, нежели текстов и двоичных данных, но углубляться в подробности - крайне вредно). И то - половина смысла mp3 и jpeg состоит в том, что и там и там - потеря части информации приемлемая цена за улучшение компрессии и от смысла сигнала зависит то, чем именно можно пренебречь.

(Reply to this) (Parent) (Thread)

From:	erdferkel
Date:	November 20th, 2005 - 07:39 pm

(Link)

Ну, значит, тут я Вас правильно понял. И соответственно ответил - метафора нехорошая, не бывает в жизни такого, чтобы информация была "до" (отдельно от) "алгоритмов сжатия" и порождаемых ими "статистических моделей". "Чистые данные опыта" - это позитивистская выдумка.

Другое дело - что иногда информация начинает приходить такая, что в рамках существующих алгоритмов работы с нею (каковая работа, повторяю, неотделима от самого процесса принятия информации) получается полная херня. Тогда надо менять алгоритм.

(То есть я при этом считаю, в отличие от многих, что так можно "приблизиться к истине", - иначе говоря, что "алгоритмы" не чисто субъективны, - но это даже можно пока отставить в сторону.)

Ну вот, Вы пока что не заставили меня коренным образом пересмотреть какие-то мои общие представления. Продолжаю работать с прежними. А предсказывать людей, конечно, трудно, они сложные, чтобы хоть что-то получилось - надо долго всматриваться.

(Reply to this) (Parent)