Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2006-03-08 14:46:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Словарный запас надо измерять в Эллочках. Их нужно всего штук 100…
http://groovy-merchant.livejournal.com/1569.html
«…словарь иньских гадательных надписей 13-11 вв. до н.э. Цзягувэнь бянь (Пекин 1965) насчитывает 4 672 идеограммы. Общее количество иероглифов было несомненно несколько больше, но вряд ли существенно, составители самого словаря оценивают его приблизительно в 5 500 знаков. Переместившись на тысячу лет позже мы видим приблизительно то же количество активных иероглифов – индекс к конфуцианскому Тринадцатикнижию исчисляет 6 544 знака. Собственно, даже в наши дни знание 3 800 иероглифов обеспечивает понимание 99,9% содержания неспециальной литературы (а, скажем, знание 5 200 иероглифов увеличивает понимание до 99,99%).

(Быть может, это какое-то родовое свойство языков. Русский язык, например, состоит из примерно 5 000 морфов, корней при этом около 4 400, а остальное аффиксы. См. например, А. И. Кузнецова, Т. Ф. Ефремова. Словарь морфем русского языка. М., "Русский язык", 1986, с. 16. Запас истинных, незаимствованных корневых морфем в любом языке, вероятно, составляет около 3 000 единиц и является постоянной величиной, не зависящей от уровня развития.)»

Нет возражений? 3000 единиц – хватит понимания для 99,99% текстов любого языка?


(Читать комментарии) - (Добавить комментарий)


[info]ivanov_petrov@lj
2006-03-09 04:42 (ссылка)
Великолепно! Достоинства Эллочки не будем подвергать сомнению; я верю, что невербальные способы коммуникации у нее были на высоте и, окажись она нагишом в подъезде, она выразилась бы много красноречивее своего мужа - даже с кляпом во рту. Очень интересно про число слов. Я этих цифр не знал... Видите ли, мне это еще с одного боку интересно. Есть довольно много задач по свертке многообразия без существенной потери качества. Одна из них довольно смешная. На Земле многие миллионы видов живых существ, и изучают их систематики. А сколько видов может знать один систематик? Я тут где-то уже рассказывал: около тысячи в среднем (опытов не было. это так - мнение из разговоров), совершенно уникальные люди помнят до 3000. Это, конечно, не названий - а всей совокупности данных, название, основные синонимы, признаки, вариации. распространение и т.д. Но "отдельностей" - вот. от 1000 до трех.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]groovy_merchant@lj
2006-03-09 20:24 (ссылка)
Ну, тогда вот еще что. В реконструкциях языковых семей, как известно, выделяется слой общей для каждого такого конгломерата лексики. И вот, обычное число унаследованного фонда слов будет колебаться где-то в области трех тысяч.

Для индо-европейской семьи, скажем, восстанавливают около 3 400 общих лексем, а для алтайской что-то около 2 600. По каждому случаю реконструкции можно высказывать всякие мнения, но порядок, в общем, сохраняется. Это не значит, что слов было столько, это значит, что примерно такой фонд сохраняется спустя примерно пять или шесть тысячелетий.

Для макросемей, вроде ностратической, число реконструкций составит около полутора тысяч.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2006-03-10 04:04 (ссылка)
Тут я уже, пожалуй, утерял связь событий. Мне кажется, носители языка не разделяют заимствования и "старую" лексику. Тогда что значит утверждение (или факт...), что через 5-6 тыс. лет остается примерно 3000 слов от прежнего состояния? Можно пожумать - а еще через 5000 останется... еще несколько меньше. Или - можно подумать - есть некий минимум слов, ядро, которое всегда остается в языке, наследие предков, передаваемое майоратом. То есть я вижу сходство цифр (вокруг 3000), но не понимаю, что это значит.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]groovy_merchant@lj
2006-03-10 11:11 (ссылка)
Просто эмпирика. Пересекающееся множество лексики и.-.е. языков составит три с копейками тысячи лексем. Больше не нашли. А алтайском меньше, но это, возможно, потому что им начали заниматься позже и народу задействовано на порядок меньше. Ну, и сам алтайский старше, точнее, он раньше распался.

Собственная старая лексика и заимствования, ясное дело, не разделялись. Но здесь важно, что это были заимствования на индоевропейском уровне, сделанные до распада и.-е. языка. От того языка осталось вот столько слов, которые мы корректно умеем выделять.

(Ответить) (Уровень выше)


(Читать комментарии) -