Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2006-03-08 14:46:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Словарный запас надо измерять в Эллочках. Их нужно всего штук 100…
http://groovy-merchant.livejournal.com/1569.html
«…словарь иньских гадательных надписей 13-11 вв. до н.э. Цзягувэнь бянь (Пекин 1965) насчитывает 4 672 идеограммы. Общее количество иероглифов было несомненно несколько больше, но вряд ли существенно, составители самого словаря оценивают его приблизительно в 5 500 знаков. Переместившись на тысячу лет позже мы видим приблизительно то же количество активных иероглифов – индекс к конфуцианскому Тринадцатикнижию исчисляет 6 544 знака. Собственно, даже в наши дни знание 3 800 иероглифов обеспечивает понимание 99,9% содержания неспециальной литературы (а, скажем, знание 5 200 иероглифов увеличивает понимание до 99,99%).

(Быть может, это какое-то родовое свойство языков. Русский язык, например, состоит из примерно 5 000 морфов, корней при этом около 4 400, а остальное аффиксы. См. например, А. И. Кузнецова, Т. Ф. Ефремова. Словарь морфем русского языка. М., "Русский язык", 1986, с. 16. Запас истинных, незаимствованных корневых морфем в любом языке, вероятно, составляет около 3 000 единиц и является постоянной величиной, не зависящей от уровня развития.)»

Нет возражений? 3000 единиц – хватит понимания для 99,99% текстов любого языка?


(Читать комментарии) - (Добавить комментарий)


[info]yurvor@lj
2006-03-08 13:15 (ссылка)
3000 единиц – хватит понимания для 99,99% текстов любого языка?

Про 99% уже сказали. Я же хочу заметить, что тут может быть тонкая подмена. 99% текстов, или 99% содержания всех текстов... Т.е. грубо говоря, в каждом из неспециальных текстов основной смысл (99% смысла) можно уловить, зная 3-5 000 морфем.

Однако зачастую основная идея текста (если она есть, конечно) заключена в очень небольшом количестве фраз. Которые вполне могут попасть в этот 1%...

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2006-03-08 16:17 (ссылка)
Да, я думаю - именно как Вы сказали. имелось в виду - 99% каждого из текстов.

(Ответить) (Уровень выше)


(Читать комментарии) -