Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2012-10-21 07:04:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Миры Щербакова 7
Анализ частоты слов в корпусе текстов М. Щербакова. Прилагательные

Рассказ о том, что можно выяснить из анализа частоты употребления существительных, не закончен, из более чем полусотни слов показаны всего несколько картинок.
Попробуем посмотреть также несколько картин для прилагательных, чтобы представлять разнообразие материала.

Для примера – фрагмент таблицы для прилагательных



Обозначения такие же, как в таблице для существительных. Штриховка слева направо – для слов, которые в списке Щербакова повысили свое место по сравнению с общей частоткой, а штриховка справа налево – для слов, которые в списке Щербакова понизили свое место по сравнению с общей частоткой.

Напомню, отнесение к классу слов (частей речи) бралось из готовой базы, частотки Щербакова. Поэтому слово «коий» попало в прилагательные, но на дальнейшем нашем анализе это никак не сказывается.

Итак, список прилагательных, которых нет в тысяче самых употребительных слов и они входят в сто наиболее употребительных слов у Щербакова:

Иной, любой, коий, прочий, звонкий, влюбленный, бравый

Список прилагательных, существенно более часто употребляемых у Щербакова, чем в общей частотке:

Белый, черный, милый, прекрасный, вечный, плохой/худший/хуже, правый/прав, чужой, голубой, темный, земной, пустой, гордый, единый, долгий, золотой, левый, морской, холодный, зеленый, злой, слепой, дальний, слабый, сладкий, твердый, честный, былой, густой, мертвый, неведомый, слышный, вольный, круглый, нежный, несчастный, глупый, видный, влажный, небесный, немыслимый, чуждый, горький

Объединяем – список более часто употребляемых и тех, которых нет в тысяче самых употребительных, получаем положительный список прилагательных, то есть более часто, чем в общей речи, употребляемых у Щербакова прилагательных (напомню, сравнение не по показателю частоты в таблице, а по месту в частотном списке):

Иной, белый, черный, любой, милый, прекрасный, вечный, плохой/худший/хуже, правый/прав, чужой, голубой, темный, земной, пустой, гордый, коий, единый, долгий, золотой, левый, морской, прочий, холодный, зеленый, злой, слепой, дальний, слабый, сладкий, твердый, честный, былой, густой, звонкий, мертвый, неведомый, слышный, вольный, круглый, нежный, несчастный, глупый, видный, влажный, влюбленный, небесный, немыслимый, чуждый, бравый, горький

Список прилагательных, которых вообще нет в корпусе Щербакова, а они входят в сотню самых употребимых прилагательных русского языка:

Российский, современный, экономический, федеральный, международный, возможный, национальный, определенный, специальный, научный, старший

Теперь сразу дадим отрицательный список – эти вообще не употребляющиеся Щербаковым прилагательные и прилагательные, которые входят в первую сотню самых употребимых в русском языке прилагательные, но сильно реже встречающиеся в стихах Щербакова:

Должен, российский, русский, общий, высокий, главный, маленький, государственный, советский, настоящий, старый, разный, собственный, основной, подобный, следующий, равный, известный, военный, огромный, политический, московский, современный, социальный, ранний, крупный, внутренний, экономический, федеральный, различный, необходимый, единственный, человеческий, международный, американский, широкий, мировой, возможный, отдельный, средний, интересный, национальный, общественный, детский, определенный, низкий, поздний, специальный, научный, реальный, способный, старший, личный, свободный.

Для примера проведем анализ одного из прилагательных, которое имеет место в частотке более высокое, чем в общей частотке.

Гордый

Анализ прилагательного гордый удобно вести вместе с рядом других слов. В данном случае работает все семантическое гнездо, давая близкие значения.

Гордость, Гордо, Гордиться, Горделивый, Гордыня

Со словом гордый связаны два устойчивых ряда метафор. Положительные ассоциации у гордости – с горами (они противостоят, как мы помним, пескам – как жизнь смерти, как радость страданию). Там же, рядом с горами – блеск вершин и безоблачное небо.

Отрицательные ассоциации, оппозиции горам – болото, влажная среда, хлябь. То есть рядом с гордостью пески меняются на болота и хляби.

Другой положительный ряд ассоциаций к гордости и однокоренным словам – счастье, фавор. Опять же, как жизнь смерти, неожиданное счастье противостоит смыкающейся над головой черной волне.

Кроем этих более устойчивых рядов ассоциаций можно подобрать два лагеря слов – союзников и противников гордости. Ясно, что в художественном мире Щербакова гордость имеет положительное значение, это не отрицательное качество. И к гордости (гордый, гордиться и пр.) идут ассоциации поднятой головы, твердого шага, (при)годности, действий, несмотря на слабость и вопреки ей. Такова гордость у Щербакова. Более случайные, одиночные связи у гордости – с богатством, славой, знатностью, ранимостью, невозмутимостью. Сюда же относится окружающий гордого дым неудач – дым, как мы помним еще по облакам, оценивается у Щербакова весьма положительно.

Есть и набор качеств оппозиции гордости, сопровождающих ситуацию «не горд». Это чума, крик, плач, слезы, слабость, скука, равнодушие, склоненная голова, страх, траур и пр. Тут же и пустыня – как можно видеть по Облаку, пустыня, равнина, песок – это весьма негативные образы в мире Щербакова.




Анализ слова «гордый» показал его место среди уже знакомых нам, означенных понятий, место которых в картине мира поэта мы с некоторой уверенностью различаем. «Гордый» связано с «блеском вершин», положительно связано, и противопоставлено равнине, хлябям и болоту, слова с довольно отрицательным значением в данном художественном мире. Горные вершины оказались связаны со «счастьем», причем в специальном значении – не «заслуженным счастьем», а с «неожиданным фавором». Ниже мы приводим россыпь слов, которые связаны с тем или иным полюсом семантической схемы, отрицательные и положительные слова. Пока они могут служить лишь намеками и заготовками – возможно, при анализе других когнитивных схем для других слов их значение прояснится.

А пока мы видим, как выражения обретают значение именно в данном художественном мире. Из общих соображений выражение «дым неудач» следовало бы рассматривать скорее как отрицательное – неудачи хуже удач, а дым – что дым? Тот же прах, только воздушный. Но это следует из нейтральной, общепринятой семантики. В данном же художественном мире, куда мы заглянули, где «свет» – игрушка поэта, самыми страшными являются слова «оковы» и «кандалы», где горные вершины противостоят пустыням и равнинам, а ходьба, хотя бы самая медленная – противопоставлена даже самому ленивому и безболезненному лежанию кверху пузом – в этом мире «дым неудач» оказывается положительным значением.


(Добавить комментарий)

Достать чернил и...
[info]nomen_nescio@lj
2012-10-21 00:49 (ссылка)
Вы, наверное, знаете апокрифическую историю про "мыть и какать". Но на всякий случай я её приведу.
Несколько лет назад был проведён частотный анализ употребления глаголов в текстах Щербакова. Чтобы учесть все глагольные формы, использовали какую-то компьютерную программу, кажется, словообразовательный словарь Зализняка. Результаты поразили: одними из самых часто употребляемых глаголов оказались "мыть" и "какать".
Ларчик просто открывался: тупая программа не поняла двузначность слов "моя" и "какая".

Но это я так, к слову. А работа большая и полезная. Не для понимания творчества Щербакова - как было сказано Фрегимусом, для Михал Константиныча важнее всего игра масками и метафоры, а этого такой анализ не учтёт. А для изучения того, как поэт конца ХХ века обращается с русским языком.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2012-10-21 01:37 (ссылка)
Да, конечно, с машинными методами всегда так - надо проверять вручную и посматривать. Кажется, я несколько посматривал, но, конечно, мало ли.

Насчет понимания творчества и масок... Более всего можно ошибиться (и вознегодовать), если принимать этот анализ как окончательный, претендющий на полноту и проч. Это чушь, конечно. Он очень поверхностный. Тут смысл в том, что такой довольно тупой метод может наталкивать на соображения, которые бы не пришли в голову. Тоже обычное свойство "машинных" методов - они перебирают тонны руды и достают невидные варианты, а уж их ценность надо оценивать ными способами

(Ответить) (Уровень выше)


[info]kcmamu@lj
2012-10-21 02:47 (ссылка)
Тут бы не валить все отличия в одну кучу, а отдельно смотреть, например, какими словами язык Щербакова выделяется из авторской песни, авторская песня -- из поэзии, поэзия -- из художественной литературы, а та -- из всего языка.

(Ответить) (Ветвь дискуссии)


[info]amigofriend@lj
2012-10-21 03:12 (ссылка)
а весь язык - из всего мироздания

(Ответить) (Уровень выше)


[info]ivanov_petrov@lj
2012-10-21 04:47 (ссылка)
Разумеется, это было бы хорошо. Давайте ссылку на полную частотку всей авторской песни.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kcmamu@lj
2012-10-21 20:17 (ссылка)
Где ж ее взять...

Тут, наверное, достаточно работать с частотами словоформ -- которые подсчитываются на лету по корпусу текстов.

И лучше упорядочивать не по частотам, а по более "сглаживающим" характеристикам. Вроде такой: если в отдельном тексте словоформа встречается n раз, то припишем ей число 1+1/2+...+1/n; для корпуса из многих текстов возьмем сумму таких величин по всем его текстам.

(Ответить) (Уровень выше)


[info]stepanbezusov@lj
2012-10-24 07:00 (ссылка)
http://aftershock.su/?q=node/16735

Вот, человек реконструирует миры Повести временных лет по похожей методике, если интересно.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2012-10-26 01:43 (ссылка)
спасибо, очень интересно

(Ответить) (Уровень выше)