Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2006-03-08 14:46:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Словарный запас надо измерять в Эллочках. Их нужно всего штук 100…
http://groovy-merchant.livejournal.com/1569.html
«…словарь иньских гадательных надписей 13-11 вв. до н.э. Цзягувэнь бянь (Пекин 1965) насчитывает 4 672 идеограммы. Общее количество иероглифов было несомненно несколько больше, но вряд ли существенно, составители самого словаря оценивают его приблизительно в 5 500 знаков. Переместившись на тысячу лет позже мы видим приблизительно то же количество активных иероглифов – индекс к конфуцианскому Тринадцатикнижию исчисляет 6 544 знака. Собственно, даже в наши дни знание 3 800 иероглифов обеспечивает понимание 99,9% содержания неспециальной литературы (а, скажем, знание 5 200 иероглифов увеличивает понимание до 99,99%).

(Быть может, это какое-то родовое свойство языков. Русский язык, например, состоит из примерно 5 000 морфов, корней при этом около 4 400, а остальное аффиксы. См. например, А. И. Кузнецова, Т. Ф. Ефремова. Словарь морфем русского языка. М., "Русский язык", 1986, с. 16. Запас истинных, незаимствованных корневых морфем в любом языке, вероятно, составляет около 3 000 единиц и является постоянной величиной, не зависящей от уровня развития.)»

Нет возражений? 3000 единиц – хватит понимания для 99,99% текстов любого языка?


(Читать комментарии) - (Добавить комментарий)


[info]groovy_merchant@lj
2006-03-10 11:11 (ссылка)
Просто эмпирика. Пересекающееся множество лексики и.-.е. языков составит три с копейками тысячи лексем. Больше не нашли. А алтайском меньше, но это, возможно, потому что им начали заниматься позже и народу задействовано на порядок меньше. Ну, и сам алтайский старше, точнее, он раньше распался.

Собственная старая лексика и заимствования, ясное дело, не разделялись. Но здесь важно, что это были заимствования на индоевропейском уровне, сделанные до распада и.-е. языка. От того языка осталось вот столько слов, которые мы корректно умеем выделять.

(Ответить) (Уровень выше)


(Читать комментарии) -