|   | 
[Nov. 19th, 2005|07:36 am] | 
 
| 
 |  
|
   | 
| Comments: |  
Ох. Ну, считайте, что из исследовательского любопытства. Проклассифицировал, посмотрел на дальнейшее поведение, посмотрел, что не сходится, уточнил классификацию. И т.д., пока не надоест.
   
![[User Picture]](http://lj.rossia.org/userpic/172165/60)  | | From: |  kouzdra |  
| Date: | November 20th, 2005 - 06:46 pm | 
|---|
 
  |        |   | (Link) |  
  |  
 Я, честно говоря, не вижу никакого самодостаточного "исследовательского смысла" в классификации чего-либо. Мне более интерсно построение модели, обладающей предсказывающими возможностями. Но тут классификации в большинстве случаев вредны. Я к чему сжатие информации вспоминал - там "информация" - это (несколько упрощенно) просто поток битиков, генерируемым каким-то черным ящиком. А алгоритмы сжатия строят как раз статистическую модель (вот прямо так и называется), которая и используется для более компактного представления.
  Один из главных принципов - ни в коем случае не пытаться подстраивать алгоритмы под конкретный "содержательный" смысл информации. "общие" методы работают лучше. Типы источников есть разные - в этом смысле действительно имеет место классификация, но смысл ее исключительно в том, что одни алгоритмы лучше работают с одним типом, другие - с другими. 
  А Ваш подход мне напоминает усиленные попытки придумать какие "слова" запихнуть в словарь упаковщика. Это не работает почти никогда.
  Можно подстроиться под обхий характер сигнала (скажем сжатие mp3 или картинкок делаются по другому, нежели текстов и двоичных данных, но углубляться в подробности - крайне вредно). И то - половина смысла mp3 и jpeg состоит в том, что и там и там - потеря части информации приемлемая цена за улучшение компрессии и от смысла сигнала зависит то, чем именно можно пренебречь.  
Ну, значит, тут я Вас правильно понял. И соответственно ответил - метафора нехорошая, не бывает в жизни такого, чтобы информация была "до" (отдельно от) "алгоритмов сжатия" и порождаемых ими "статистических моделей". "Чистые данные опыта" - это позитивистская выдумка.
  Другое дело - что иногда информация начинает приходить такая, что в рамках существующих алгоритмов работы с нею (каковая работа, повторяю, неотделима от самого процесса принятия информации) получается полная херня. Тогда надо менять алгоритм.
  (То есть я при этом считаю, в отличие от многих, что так можно "приблизиться к истине", - иначе говоря, что "алгоритмы" не чисто субъективны, - но это даже можно пока отставить в сторону.)
  Ну вот, Вы пока что не заставили меня коренным образом пересмотреть какие-то мои общие представления. Продолжаю работать с прежними. А предсказывать людей, конечно, трудно, они сложные, чтобы хоть что-то получилось - надо долго всматриваться.
    |    |