Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет bars_of_cage ([info]bars_of_cage)
@ 2006-06-17 00:19:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
[info]Mitrius@ljпришло "в голову получить для Корпуса русского языка такой показатель, как средняя длина слова в тексте (т. е. число байт / число слов) и выстроить тексты по этому параметру(*). (...) Получается, -- ожидаемо, -- что этот параметр рос с течением времени: самые короткословные (со средним словом короче 7 байт) -- почти сплошь люди XIX века, причём в первой лаконичной десятке люди XVIII века Лабзина и Болотов. В первой сотне много текстов Лескова, Достоевского, Гончарова. Для нашего восприятия Толстого, с его "обезматочившими", любопытно, что толстовская "Исповедь" написана необычно короткими словами -- 6,1 байт в среднем, лаконичен граф и в письмах (6,3), а волю словообразованию даёт в художественных текстах. Впрочем, например, во втором томе "Войны и мира" не такие и длинные слова -- всего 6.57 (до сотой столько же, сколько в "Двух капитанах" Каверина, и даже меньше, чем в "Капитанской дочке" :))). Из короткословных авторов XX века примечательны Битов, Галина Щербакова, Саша Соколов: они регулярно дают показатели, характерные для авторов 1780-1790-х годов рождения. (...)"

Дух захватывает, когда кто-то сумеет взглянуть на известные вещи совершенно просто и совершенно неожиданно.


(Добавить комментарий)


[info]d_accord@lj
2006-06-16 18:14 (ссылка)
Следующим шагом будет написание кода к написанию Войны и Мира :)

(Ответить) (Ветвь дискуссии)


[info]bars_of_cage@lj
2006-06-17 03:50 (ссылка)
да? а мне показалось интересным как раз то, что исследователь сознательно не берется ничего выстраивать, а берет совершенно беспристрастно самый внешний показатель - и, оказывается, и он говорит.

(Ответить) (Уровень выше)


[info]a1tyn@lj
2006-06-17 00:25 (ссылка)
Интересно, были ли какие-то исследования по этой теме в философии языка? с ходу ничего не нашла, лет 15 назад точно ничего такого не подсчитывалось. А какой богатый материал, неужели никто не использовал?

(Ответить) (Ветвь дискуссии)


[info]bars_of_cage@lj
2006-06-17 03:52 (ссылка)
это вам лучше спросить у Митриуса, я ведь так, восхищаюсь со стороны. Сходные исследования наверняка были в эпоху появления ЭВМ. В докомпьютерную эру, вероятно, не проводились. Даже не по причине нудности подсчетов. Мозг был не повернут в эту сторону.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]a1tyn@lj
2006-06-17 19:43 (ссылка)
Спасибо, спрошу.

> Мозг был не повернут в эту сторону.

Он и сейчас не у всех повернут, к сожалению :(
Слишком часто приходится видеть пренебрежение "лириков" точными науками и "физиков" философией.

(Ответить) (Уровень выше)


[info]ivanov_petrov@lj
2006-06-17 04:47 (ссылка)
Арапова можно посмотреть...

(Ответить) (Уровень выше)


[info]ivanov_petrov@lj
2006-06-17 02:57 (ссылка)
Там хорошо бы еще частотку им построить. очень бывают характерные картины - и интересно, кто окажется в подобных классах картин

(Ответить) (Ветвь дискуссии)


[info]bars_of_cage@lj
2006-06-17 03:54 (ссылка)
а что такое частотка? график изменений бы дать, вдоль оси десятилетий и наиболее характерными авторами на пиках и в ущельях. И набирать, набирать материал - наверное, чем больше его будет, тем все окажется неожиданней. Пойду к Митриусу, погляжу, что там делается.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2006-06-17 04:00 (ссылка)
таблица соответствий словоформы и частоты употребления. Ясное дело, есть народ, который имеет выраженное ядро употреблений. часто использует некоторые слова - ну и хвостик редких. А есть народушко, у которого чуть не все слова всего по разу употребляются - огромный такой кометный хвост. кажется, у Щербакова такая картина

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bars_of_cage@lj
2006-06-17 04:11 (ссылка)
Набоков в русские годы старался сохранить точность словоупотребления (то, что называется богатством языка), регулярно читая Даля, а в американские не расставался с Вебстером - но, кажется, именно англоязычные читатели воспринимали богатство его лексики чем-то чужеродным. Нет ли оснований считать, что такой кометный хвост дает разметанность народа на малосочлененные друг с другом сословия, удаленность носителей языка друг от друга, общую разреженность и (ох, несет уже в самовырытую себе яму) газообразность общества? уф, связи с широтой космической территории удалось хоть избежать.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2006-06-17 04:47 (ссылка)
Я не очень понимаю, что значит "дает". Что ассоциации именно такие - я понимаю. когда-то пробовал считать скорость социального времени по числу упомянутых событий в опросах. Там у меня был показатель - что-то вроде "единства времени" - когда тысяча человек упоминает всего 2-3 события - высокое единство, и когда - скажем. событий 150 (низкое). Ясно, что общество вокруг некоторых событий-новостей собирается, уплотняется, а в другое время - расходится в своё разномыслие и в собственные миры, где события различны. Но в словах поэта - чтобы его словарь увеличивать социальную разобщенность своим разнообразием? Как-то странно... Мне казалось, это просто интересно - ведь не случайный показатель. язык богатый с множеством одиночных словоупотреблений - совсем другая эстетика, чем выверенный язык на небольшом отлаженном словаре

(Ответить) (Уровень выше)


[info]gdt@lj
2006-06-17 06:55 (ссылка)
а ты разве не видел делицинский "худломер"?

(Ответить) (Ветвь дискуссии)


[info]bars_of_cage@lj
2006-06-17 11:25 (ссылка)
никогда не слышал. Сходил-посмотрел - забавно, что статью Митриуса (как и начало моего текста про повседневность) он назвал худлом, а вот нашу переписку с Ивановым_Петровым выше (и мой коммент, и И_П) - определил газетной статьей.

Ссылка для ленивых:
http://teneta.rinet.ru/2001/hudlomer/

(Ответить) (Уровень выше)