Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет bars_of_cage ([info]bars_of_cage)
@ 2006-06-17 00:19:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
[info]Mitrius@ljпришло "в голову получить для Корпуса русского языка такой показатель, как средняя длина слова в тексте (т. е. число байт / число слов) и выстроить тексты по этому параметру(*). (...) Получается, -- ожидаемо, -- что этот параметр рос с течением времени: самые короткословные (со средним словом короче 7 байт) -- почти сплошь люди XIX века, причём в первой лаконичной десятке люди XVIII века Лабзина и Болотов. В первой сотне много текстов Лескова, Достоевского, Гончарова. Для нашего восприятия Толстого, с его "обезматочившими", любопытно, что толстовская "Исповедь" написана необычно короткими словами -- 6,1 байт в среднем, лаконичен граф и в письмах (6,3), а волю словообразованию даёт в художественных текстах. Впрочем, например, во втором томе "Войны и мира" не такие и длинные слова -- всего 6.57 (до сотой столько же, сколько в "Двух капитанах" Каверина, и даже меньше, чем в "Капитанской дочке" :))). Из короткословных авторов XX века примечательны Битов, Галина Щербакова, Саша Соколов: они регулярно дают показатели, характерные для авторов 1780-1790-х годов рождения. (...)"

Дух захватывает, когда кто-то сумеет взглянуть на известные вещи совершенно просто и совершенно неожиданно.


(Читать комментарии) - (Добавить комментарий)


[info]ivanov_petrov@lj
2006-06-17 04:00 (ссылка)
таблица соответствий словоформы и частоты употребления. Ясное дело, есть народ, который имеет выраженное ядро употреблений. часто использует некоторые слова - ну и хвостик редких. А есть народушко, у которого чуть не все слова всего по разу употребляются - огромный такой кометный хвост. кажется, у Щербакова такая картина

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]bars_of_cage@lj
2006-06-17 04:11 (ссылка)
Набоков в русские годы старался сохранить точность словоупотребления (то, что называется богатством языка), регулярно читая Даля, а в американские не расставался с Вебстером - но, кажется, именно англоязычные читатели воспринимали богатство его лексики чем-то чужеродным. Нет ли оснований считать, что такой кометный хвост дает разметанность народа на малосочлененные друг с другом сословия, удаленность носителей языка друг от друга, общую разреженность и (ох, несет уже в самовырытую себе яму) газообразность общества? уф, связи с широтой космической территории удалось хоть избежать.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2006-06-17 04:47 (ссылка)
Я не очень понимаю, что значит "дает". Что ассоциации именно такие - я понимаю. когда-то пробовал считать скорость социального времени по числу упомянутых событий в опросах. Там у меня был показатель - что-то вроде "единства времени" - когда тысяча человек упоминает всего 2-3 события - высокое единство, и когда - скажем. событий 150 (низкое). Ясно, что общество вокруг некоторых событий-новостей собирается, уплотняется, а в другое время - расходится в своё разномыслие и в собственные миры, где события различны. Но в словах поэта - чтобы его словарь увеличивать социальную разобщенность своим разнообразием? Как-то странно... Мне казалось, это просто интересно - ведь не случайный показатель. язык богатый с множеством одиночных словоупотреблений - совсем другая эстетика, чем выверенный язык на небольшом отлаженном словаре

(Ответить) (Уровень выше)


(Читать комментарии) -