Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет ivanov_petrov ([info]ivanov_petrov)
@ 2011-10-20 15:58:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Минимальный словник
200-словный стандартный список Сводеша с уточнённым переводом с английского, учётом комментариев к нему и подстройкой большинства значений лексем так, как они наиболее часто воспринимаются в английском языке в своём базовом значении.

То есть это самые устойчивые понятия. В некотором смысле - это попытка реконструкции самых базовых, первых понятий человечества.

я
ты
он, она, оно
мы
вы (мн. число)
они
этот, эта, это (максимально ближний предмет)
тот, та, то (максимально удалённый предмет)
здесь, тут (максимально близко)
там (максимально далеко)
кто
что
где
когда
как
не
всё (на свете); также допускается «все (люди)» (all)
много (большое количество)
несколько, немного (среднее количество) (some)
мало (малое количество)
другой (человек), другие (люди)
один
два
три
четыре
пять
шесть
большой (дом, предмет)
длинный (предмет)
широкий
толстый (предмет)
тяжёлый
маленький
короткий
узкий
тонкий (предмет)
женщина
мужчина
человек
ребёнок
жена
муж
мать
отец
зверь (дикое животное)
рыба
птица
собака
змея
дерево
лес
палка («ударил палкой»)
плод (фрукт)
семя (растения)
лист (дерева)
корень (растения)
кора (дерева)
цветок
трава
верёвка
кожа
мясо
кровь
кость
яйцо
рог
хвост
перо (птицы)
волос(ы)
голова
ухо
глаз
нос
рот
зуб
язык
ноготь
нога (стопа)
колено
рука (кисть)
крыло
живот (от пупка до промежности)
шея
спина
грудь
сердце
печень
пить (воду)
есть (кушать)
кусать (зубами); грызть
дуть (о ветре); отдельно допустимо также «дуть на свечу»
дышать
смеяться
видеть
слышать
знать
думать
чувствовать запах; отдельно допустимо также «нюхать ноздрями» (smell)
бояться (опасности)
спать
жить
умирать
убивать
бороться, воевать (с врагом) (fight)
охотиться (в лесу)
ударить (однократно рукой)
резать (предмет ножом)
(раз)рубить (бревно топором) (split)
воткнуть, вонзить (нож) (stab)
царапать
копать, рыть (яму)
плавать («умеет плавать»)
летать
ходить, идти (шагом)
приходить, прийти
лежать
сидеть
стоять
повернуть («идя по дороге, повернуть направо») (turn)
падать (вертикально вниз)
давать
держать (рукой)
сжимать, давить (рукой с силой)
тереть (многократно)
мыть (руки)
вытирать (пыль)
тянуть (на себя)
толкать (вперёд, от себя)
бросать (камень)
привязать; связать (верёвкой)
шить (рубашку)
считать (числа)
сказать («он что-то сказал»)
петь (песню)
играть («дети играют»)
плавать («дерево плавает, не тонет»)
течь («река течёт»)
замёрзнуть («вода замёрзла»)
солнце
луна (полная)
звезда
вода
дождь (средней силы)
река (крупная или средняя)
озеро
море
камень («бросил камень»)
песок
пыль
земля (грунт)
облако
туман (достаточно густой)
небо
ветер
снег
лёд
дым
огонь
зола, пепел (от костра)
гореть («огонь горит»)
дорога (грунтовая)
гора (достаточно высокая)
красный
зелёный
жёлтый
синий
белый
чёрный
ночь
день
год
тёплый (о погоде)
холодный (о погоде)
полный (стакан)
новый
старый (предмет)
хороший (качественный)
плохой (некачественный)
гнилой
грязный (возможно, ребёнок)
прямой (линия, дорога)
круглый
острый (нож)
тупой (нож)
гладкий, ровный (на ощупь)
мокрый
сухой
правильный (верный)
близкий («живёт близко»)
далёкий («живёт далеко»)
правый
левый
у, возле
в («в доме»)
на («на камне»)
с (вместе с кем-то)
и
если
потому что
имя (человека)


-------------------------------

Я сказал, что это базовые понятия. Сами лингвисты такой чуши не говорят (вроде бы), для них это техническое средство при установлении родства языков, и всё. Но: есть энное количество публикаций, где делают разные люди попытки построить именно словарь базовых понятий, основных концептов человечества. Я эти попытки сравнил со списком Сводеша и говорю: в общем, это примерно одно и то же. То есть у Сводеша меньше, те попытки обычно поболе размером, и там есть важные понятия, но это уже другой разговор - по строению и наличию всяких особенно важных слов это примерно те же штуки.

Конечно, другой список можно было бы составить, и больше - но дело в том, что лингвистами список этот не увеличивается, а уменьшается. Его используют для датирования языков, и чем строже отобраны слов, тем достовернее результаты. Как я слышал, вообще-то лучше всего обходиться прямо-таки минимальным списком из 25 слов. Даже 100-словник великоват.

Хотя тут - в 200-словнике - нет "любить" и нет "чистого", нет "испраженений", "эйякуляции", нет "колдуна" или "шамана", нет "рисовать" - мало ли чего. Но в общем - даже странно, отчего список базовых понятий человечества используют только лингвисты и только в целях установления родства языков.

Конечно, в семантике используют - словари Огдена или Гугенхейма, там примерно 1000-1500 базовых слов. Конечно, есть Анна Вежбицкая. Но у Вежбицкой, как оказалось, тоже остаётся много лишних деталей, ей много не надо. Вот её минимальный словарь:


"В течение семи лет, потраченных мною на поиски элементарных смыслов, число предполагаемых кандидатов систематически уменьшалось. В настоящее время я придерживаюсь мнения, что их число колеблется приблизительно от десяти до двадцати. Вот перечень кандидатов, представляющихся мне наиболее подходящими в настоящее время:

хотеть

нечто

не хотеть

некто (существо)

чувствовать

я

думать о...

ты

представлять себе

мир (вселенная)

сказать

это

становиться

быть частью"

http://www.belb.net/obmen/Wierzbicka.htm


"Моя гипотеза состоит в том, что с помощью этих элементов (или их эквивалентов в любом другом естественном языке) окажется возможным истолковать все речевые высказывания и описать все семантические отношения, существующие между различными выражениями."

"Можно ли действительно обойтись без таких слов, как причина, истина, мужской пол, женский пол, существовать, множество, животное, растение, организм, тело, больше, очень, подобный, тот же самый, равный, начало, конец, мочь, хороший, плохой и живой? А таких, как и, не, если и все? Действительно ли можно свести значения этих слов к каким-то более фундаментальным?

Я полагаю, что можно. Причина, по моему мнению, не может рассматриваться как элементарный смысл, потому что она связана со словом если и может быть перефразирована через это слово (ср. Х было причиной Y - если бы не X, то Y не произошло бы). Слово истина связано со словами думать, сказать и, возможно, также хороший (истинно и ложно представляют собой род оценки, подобно красивому и уродливому). Хороший и плохой в свою очередь связаны с желанием. Тело (тело X), вероятно, может быть истолковано как "нечто, о чем можно думать (думают?) как об X". Во всяком случае, тело, конечно, представляет собой "нечто", так же как и растение и животное. Больше и множество связаны с понятием "части". Если что-то существует, то, значит, о нем может быть что-то сказано [То exist is to be "referable to"]; таким образом, существование связано со словами это и сказать (Кентавры не существуют = Нельзя сказать, думая о чем бы то ни было: это кентавр). Начало и конец связаны друг с другом, так же как хороший и плохой. И так далее. Более подробное рассмотрение этих и других отвергнутых кандидатов на положение неопределяемых элементов можно найти в последующих главах."


-----------------
То есть когда люди в самом деле берутся решать какую-то задачу - скажем, создать минимальный словарь, которым можно истолковать все прочие слова - они приходят к очень небольшому числу базовых понятий.

Тут интересно вот что. Скажем, было бы интересно смотреть на минимальные словники, сделанные для разных задач. У меня подозрение - они не совпадут. То есть: можно минимизировать язык до очень небольшого числа форм - но в рамках данной задачи. А для другой тоже будет надо мало, но несколько иных. Отсюда: представляющиеся универсальными задачи минимизации на деле работают с перехлестом. Они делают больше, чем должны - получаемые в таких случаях минимальные наборы не соответствуют ничему, кроме того функционала, который для них придуман. Скажем, минимальная бактерия, минимальный живой организм будет означать только то, что когда люди решили построить минимальную бактерию, у них получилось вот такое-то существо, и ничему больше это не соответствует.
Но это подозрение.

Другое: вроде бы всякие люди очень сильно нуждаются в неких четко ограниченных базовых словарях. Это всякие попытки создать минимальный язык общения, и естественный язык для ИИ, и философы, и задачи перевода - и вообще масса направлений. Пробовали делать перевод? Переводятся только базовые, скажем, а прочие - толкованиями к базовому, это работа семантики на одном языке и минимальное количество перевода. Или это только хуже? Или - множество идей сделать искусственный язык интернационального общения. Делали его на основе базовых словников?

Интересно, пытались ли они использовать имеющиеся минимальные словники - или изобретают подручными средствами своё. То есть занятно сопоставить, какие базовые словники получаются при разных задачах - здесь уже будут, конечно, преимущественно тысячесловники. И интересно, подходят - не подходят - почему одни словники для других задач.


(Добавить комментарий)

эту песню не задушишь, не сводеш
[info]arno1251@lj
2011-10-20 09:06 (ссылка)
+++
я
ты
он, она
+++
вместе целая страна

(Ответить) (Ветвь дискуссии)

Re: эту песню не задушишь, не сводеш
[info]ivanov_petrov@lj
2011-10-20 12:16 (ссылка)
причем поют ее уже несколько десятков тысяч лет

(Ответить) (Уровень выше)


[info]squadette@lj
2011-10-20 09:19 (ссылка)
простите
Вежбицкая по-русски пишется без "р"

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-20 09:40 (ссылка)
исправил

(Ответить) (Уровень выше)


[info]emmy_l@lj
2011-10-20 09:32 (ссылка)
120 корней в искусственном языке Токипона. :)

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-20 12:17 (ссылка)
не слышал такого

(Ответить) (Уровень выше)


[info]togo@lj
2011-10-20 09:36 (ссылка)
В этом отношении интересен словать Longman Language Activator, который создан кстати для практических целей. Там около 800 категорий (по каждой категории дана статья -- различные способы выражения этой мысли). Эти 800 статей идут в алфавитном порядке, но интересно из этих категорий строить иерархии. Вообще же эти категории дают неплохое покрытие всей лексики.

Вообще строить базисы из которых можно объяснить всё остальное (кстати в словаре Longman толкования опираются на базис что-то около 3000 слов) сильно формалисткий подход. Такая выборка действительно сильно (и в основном) зависит от целей. Кроме того такие базисы произвольны, в том смысле что существует много эквивалентных базисов. Но интересен вопрос о некоторой объективном словнике (и соответствующей иерархии категорий), только это не предмет лингвистики, в её современном приземлённом понимании.

(Ответить) (Ветвь дискуссии)


[info]togo@lj
2011-10-20 09:46 (ссылка)
То, что автор словника считает устойчивым понятием насколько я понимаю исключительно выводится и определяется из излюбленного автором алгоритма построения словника?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]togo@lj
2011-10-20 09:57 (ссылка)
А потом загвоздка ещё в том -- что значит "истолковать". Ведь один поймёт, а другой не поймёт толкования. Это всё равно не объективный аспект.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-20 12:19 (ссылка)
Видите ли, следует иметь в виду - насильного понимания не бывает. Что угодно, вплоть до логики и математики, можно не понять или не согласиться принять. В этом смысле объективного нет вовсе - не надо фантазировать про такие вещи.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]togo@lj
2011-10-20 13:20 (ссылка)
"этом смысле объективного нет вовсе"
я не вкладываю в понятие "объективное" какого-то экстремистского смысла
я просто выразил сомнение в том, что формальная идея -- искать базис через который можно выразить всё остальное -- является продуктивной при попытке осмыслить что такое "базовые понятия"; т.е. за "базовыми понятиями" должна стоять более "обширная" во всех отношениях теория

(Ответить) (Уровень выше)


[info]ivanov_petrov@lj
2011-10-20 12:18 (ссылка)
в списке Сводеша - ну, там проверяются эти слова именно на устойчивость, чтобы не лажалось. А в других случаях - по-разному бывает

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]togo@lj
2011-10-20 13:08 (ссылка)
ну, Ok
я просто не понимаю какое отношение этот список имеет к базовым понятием и что такое базовое понятие

(Ответить) (Уровень выше)


[info]ivanov_petrov@lj
2011-10-20 12:17 (ссылка)
а для каких целей?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]togo@lj
2011-10-20 13:02 (ссылка)
цель -- продавать этот словарь тем, кто изучает английский;
как пример этой целевой аудитории я лично нахожу его действительно полезным

(Ответить) (Уровень выше)


[info]ivan_babicki@lj
2011-10-20 09:53 (ссылка)
Мне не очень понятна связь между списком Сводеша и "базовостью" понятий. В список Сводеша попадают не те понятия, которые чем-то важнее, а те, которые эмпирически оказываются сильнее привязанными к конкретным словам. В индоевропейском контексте слова "восемь" и "девять" устойчивы, а слова "большой" и "маленький" неустойчивы, к понятиям это не имеет отношения. Если, напр., понятию "чёрный" в близкородственных языках часто соответствуют разные корни (англ. black и нем. schwarz, исп. negro и порт. preto), то это никак не отменяет "базовости" понятия ""чёрный" - просто обозначения цветов неустойчивы в принципе, ср. русское "красный" ("красивый") или варианты карий-бурый-коричневый.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-20 10:10 (ссылка)
на это я и отвечал в посте. "Я сказал, что это базовые понятия. Сами лингвисты такой чуши не говорят (вроде бы), для них это техническое средство при установлении родства языков, и всё. Но: есть энное количество публикаций, где делают разные люди попытки построить именно словарь базовых понятий, основных концептов человечества. Я эти попытки сравнил со списком Сводеша..."

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivan_babicki@lj
2011-10-20 10:32 (ссылка)
Полностью у Вас это звучит так: "Я эти попытки сравнил со списком Сводеша и говорю: в общем, это примерно одно и то же."
Когда говорят, что акула и косатка суть примерно одно и то же, это ещё можно понять, но косатка и касатка - это не одно и то же, даже примерно.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-20 11:21 (ссылка)
Раз это непонятно, давайте скажу подробнее. По методу составления это разные вещи. По результату - очень сходные.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivan_babicki@lj
2011-10-20 11:44 (ссылка)
Логически должны быть несходными и с приведённым Вами списком Вежбицкой так и выходит, но, может быть, Вы имеете в виду какие-то другие случаи, где совпадения действительно часты.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-20 11:49 (ссылка)
мне это казалось очевидным. Видимо, я тогда нагляделся этих списков... А Вы, видимо, на такое не смотрели. Всех ссылок я не помню, разумеется. сейчас вскользь поискал - вот например http://anthroposophie.net/ru/NotionsRT2.html

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ivan_babicki@lj
2011-10-20 11:55 (ссылка)
Спасибо.

(Ответить) (Уровень выше)


[info]dm_kalashnikov@lj
2011-10-20 10:26 (ссылка)
Basic English как-то так составляли.

(Ответить) (Ветвь дискуссии)


[info]marina_fr@lj
2011-10-20 11:04 (ссылка)
Сходным образом, если я правильно понимаю, выделяли факторы для теста Кеттелла (который личностных черт). Сопоставляя слова из английского словаря, экспертные оценки и т.д.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dm_kalashnikov@lj
2011-10-21 04:12 (ссылка)
Ещё говорят, что были планы по использованию его сродни Новоязу. То есть как оружие.

(Ответить) (Уровень выше)


[info]fandaal@lj
2011-10-20 11:32 (ссылка)
кто то рекомендовал использовать в качестве базовых понятий только предлоги или приставки. получится выразительнее.
а базовость не всегда очевидна.
в школе учим математику с арифметики, а сами математики основывают свою дисциплину на теории множеств

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-20 12:19 (ссылка)
частицы

ой ли, да не

(Ответить) (Уровень выше)


[info]dgies@lj
2011-10-20 13:33 (ссылка)
нет "испраженений", "эйякуляции", нет "колдуна" или "шамана"

Рожать - тоже нет. Вообще, вся сфера потенциальных табу (кроме убивать/умирать) не представлена. Табуирована ;)

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-20 15:20 (ссылка)
да. Я понимаю, что Вежбицкая готова это выразить в своем словнике. Но мне кажется. что тут особенно наглядно выступает. что идея создания минимального словаря понятий не имеет отношения к возникновению языка. Он соткался из избытка, а не из недостатка, это была длинная песня без слов, непрерывное звучание. которое постепенно дискретизироалось - а не набор дискретных смыслов, который постепенно расширялся.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]dgies@lj
2011-10-20 15:49 (ссылка)
Именно ;) Борис Федорович об этом и говорит, когда рассуждает о вещах и словах и поминает Марра. В частности, вот эта длинная песня без слов (или с четырьмя первословами ;) исполнялась исключительно в повелительном наклонении и с соответствующими суггестивными целями. А потом, да, дискретизировалась - и ее удалось приспособить для передачи еще и нейтральной информации, а не только (завуалированных) приказов.

(Ответить) (Уровень выше)


[info]mask_13@lj
2011-10-21 02:28 (ссылка)
Попробуйте с помощью этого словаря сказать что-нибудь важное для древнего человека, например: "Это коза, а не волк" :)

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-21 02:33 (ссылка)
Кажется, Вы меня перепутали с Вежбицкой.

(Ответить) (Уровень выше)

Мир Вежбицкой (поэза)
[info]michaellogin@lj
2011-10-21 06:58 (ссылка)
хотеть нечто
не хотеть кого-то
чувствовать я
думать о ты
представлять себе мир
сказать это
становиться частью

куда уж важнее, на все времена :о)

(Ответить) (Уровень выше)

Охотничьи языки
[info]pasha_semionov@lj
2011-10-21 04:28 (ссылка)
А вот в знаменитом фантастическом романе Фрэнка Херберта "Дюна" были "охотничьи языки", как их там называли. Там объясняется, что это такое, но я не нашёл. По памяти: охотничий язык - это специальный язык с ограниченным набором коротких слов, используется в бою (а не на охоте). Я когда-то про это кому-то рассказал, а он мне сказал, что лётчики в войне использовали для этих целей русский мат (кто его знал). Мол, там и слова короткие, и мало их, и выразительность большая... И анекдот я знаю - там речь состоит из одного мата, но всё понятно... Может, Херберт такое название не сам придумал?

(Ответить) (Ветвь дискуссии)

Re: Охотничьи языки
[info]ivanov_petrov@lj
2011-10-21 04:30 (ссылка)
язык спецназа. мы здесь, а ты туда. там двое, ваших нет. - код, не язык.

(Ответить) (Уровень выше)

Неологизм, однако...
[info]michaellogin@lj
2011-10-21 06:13 (ссылка)
"эйякуляция" - эякуляция у эксгибициониста :о)
BTW, эксгибиционист, завязавший со своим хобби, - "экс-эксгибиционист"??? :о)

(Ответить)


[info]idvik@lj
2011-10-21 07:58 (ссылка)
Я почему думал,что это похоже на создание новой математики, ну грубо вот этот базовый набор, изучить его структуру, взаимосвязи, выделить некоторые формы и это примерно будет соответствовать единице в той новой математике.

(Ответить) (Ветвь дискуссии)


[info]ivanov_petrov@lj
2011-10-21 09:32 (ссылка)
ну, видимо, так это и мыслится теми, кто хочет получить базовый набор понятий. Только вот наборов будет много и - надо дальше что-то делать. Скажем, к прорыву в переводе эта линия не привела, насколько я понимаю

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]idvik@lj
2011-10-21 09:42 (ссылка)
Конечно вы уже читали вот,но оставлю кому-то возможно это лекция .С.В Чебанова на Полит Ру.
http://www.polit.ru/article/2009/11/26/chebanov
Мне кажется это в этом же направлении, фракталы,рефрены попытка найти схожие структуры.
Морфология сказки.
И тут интересно вот,что может ли так получится,что работать с этой математикой, нельзя будет на компьютере, вы писали Выше о шве в науке в виртуальной реальности.
Но вот шов, если нельзя посчитать,создать компьютерную модель,то это ненаучно.
Это очень трудоемко.Это нельзя будет уложить в таблицы без потери понимания. Нельзя будет представить графически, как мы сейчас представляем.

(Ответить) (Уровень выше)