kassian: О составлении списков базисной лексики для древних языков + введение в проблематику (часть 1/3)

О составлении списков базисной лексики для древних языков + введение в проблематику (часть 1/3)

Подготовил доклад «Опыт составления аннотированного 50-словного списка базисной лексики для древнегреческого языка (идиолект Геродота)» для некоей индоевропеистической конференции, куда доклад в результате не попал.

Текст содержит введение с кратким обзором современных подходов к статистической классификации языков и к лексикостатистике в частности, а также часть 110-словного списка, составленного по тексту «Истории» Геродота. Главный упор предполагается именно на новом стандарте аннотированных лексических списков, который сейчас принят в нашем новом проекте The Global Lexicostatistical Database (руководитель Г. С. Старостин).

Доклад (в виде презентации с различными иллюстративными материалами) писался под конкретную аудиторию. Чтобы не пропадать добру, помещаю его здесь.

А.
С. Касьян

Опыт составления
аннотированного 50-словного списка базисной лексики для древнегреческого языка
(идиолект Геродота)

A. S. Kassian

Annotated
50-item wordlist of the basic vocabulary of the Ancient Greek language (the
idiolect of Herodotus)

В
статье дается краткий обзор современных подходов к статистической классификации
языков. В качестве образца приводится 50-словный список базисной лексики по
тексту «Истории» Геродота, составленный в соответствии со стандартами проекта «Лексикостатистическая база данных языков мира» (Москва
/ Санта-Фе).

The article discusses actual approaches to the
statistical language classification. The 50-item wordlist for the language of The
Histories of Herodotus illustrates the new lexicostatistical standard
proposed by The Global Lexicostatistical Database project (Moscow /
Santa Fe).

Классификация
языков; лексикостатистика; древнегреческий язык; Геродот

Language taxonomy; Lexicostatistics; Ancient Greek;
Herodotus

1. В
последние десятилетия мировая лингвистика демонстрирует повышенный интерес к
различным статистическим методам сравнения языков (см., напр., обзоры в [Nichols & Warnow 2008], [McMahon & McMahon 2005]). Можно
говорить о том, что данные методы постепенно становятся основным общепризнанным
инструментом для формальной классификации лингвистических идиомов. Общий
принцип таких исследований стандартен: составляется того или иного вида матрица
признаков. Эта матрица заполняется для каждого из вовлеченных в сравнение
языков. Далее соответствующие поля полученных матриц сопоставляются друг с
другом (данный параметр у двух языков совпадает = плюс, не совпадает = минус;
конкретные математические алгоритмы обработки итоговых бинарных
совпадений/несовпадений могут разниться, см. [Nichols
& Warnow 2008]). Таким образом выясняется степень
относительной близости исследуемых языков.

Языковые
данные, записываемые в матрицу, могут быть нескольких видов.

1)
Лексическая информация, т.е. списки базисной лексики. В зависимости от
методологии, при дальнейшем сравнении матриц двух языков плюс могут получать
слова, являющиеся этимологическими родственниками или же слова, обладающие
схожим фонетическим обликом (без отсылки к этимологическим обстоятельствам).

2)
Грамматические морфемы и структурные грамматические черты, являющиеся
ретенциями или инновациями по отношению к реконструированному праязыку семьи,
для которой делается классификация (напр., общие фонетические переходы,
синкретизм падежей и т. п.).

3)
Общетипологические (универсальные) грамматические признаки, формулировка
которых не зависит от специфики конкретных языков (например, базовый порядок
слов в предложении VS/SV или наличие передних огубленных гласных).

Употребление лексических матриц наиболее распространено, это классический
лексикостатистический подход (построенные таким образом деревья для языков
и.-е. семьи см., например, в [Blažek 2007] или [Gray & Atkinson 2003]). Традиционно слова сопоставляются, исходя из
наших знаний об их этимологии. Однако интересен (и в каком-то смысле
доказательнее) метод, при котором сопоставляется формальный фонетический облик
форм (используя консонантные классы, на которые можно разбить сводный инвентарь
звуков языков мира, см., напр., [Turchin et al. 2010]). Примером такого «слепого» теста на предмет
родства между современным английским и хинди является работа [Baxter
& Manaster Ramer 2000].

При желании
исследователя в одной матрице могут быть совмещены лексические данные и
предполагаемые грамматические ретенции/инновации (напр., [Ringe et al. 2002], [Nakhleh et al. 2005], [Forster
& Toth 2003] для и.-е. семьи).

Матрица,
составленная только из универсальных типологических признаков, применяется реже
(это, напр., работы [Dunn et al. 2007],
[Donohue & Musgrave 2007],
[Comrie & Cysouw 2006], [Cysouw & Comrie 2009], [Соловьев 2010], [Wichmann et al. 2011]). В защиту такого подхода
выступают некоторые типологи (см. [Campbell & Poser 2008: 298 ff.]).

Наконец,
исследователь может совместить в одной матрице универсальные типологические
признаки и лексические данные конкретных языков ([Saunders
2005], [Wichmann & Saunders
2007] для австронезийских языков).

Цели, которые преследуются при подобной статистической обработке
языковых данных, также могут разниться.

1)
Построение генеалогической классификации, т. е. попытка реконструировать
картину доисторического разделения народов.

2)
Построение ареально-типологической классификации, т. е. попытка
составить карту языковых союзов (существовавших или существующих).

3)
Математическо-экпериментальная цель, а именно, опыт применение
статистических алгоритмов, опробованных в других областях знания (математике,
биологии и т. д.), к языковому материалу.

Первую цель (генеалогическая классификация) преследует классическая
лексикостатистика; примеры многочисленны, см, напр., соответствующие разделы в
[Forster & Renfrew 2006] для различных языковых семей мира.

Обширные
дискуссии, посвященные второй цели (выявление языковых союзов), см., например,
в [Aikhenvald & Dixon 2001], [Campbell & Poser 2008: 326 ff.], [Соловьев
2010].

Третий подход
характерен для математиков или биологов, начинающих работать с языковым
материалом. Примером может служить статья [Blanchard et al. 2011], где авторы
получают 400 год до н. э. как дату разделения индоиранского
праязыка на праиндийскую и праиранскую ветви (sic!).
Факт, что это не смутило ни авторов, ни редакторов журнала, показывает, что реконструкция
исторической реальности не была целью статьи.

Основные типы визуального представления полученной языковой классификации
таковы.

1)
Двухмерное дерево (связный граф, не содержащий циклов.), см.
рис. 1.

20.17 КБ

Рис. 1. Пример древесного представления:
лексикостатистическое дерево цезской группы северокавказской семьи (составлено
автором по 110‑словным спискам)

2)
Двухмерный циклический граф, т. н. network
(или, более полно, implicit phylogenetic network), см. рис. 2. Видимо, такие модели можно считать
трехмерными, проецированными на двухмерную плоскость.

46.69 КБ

Рис. 2. Пример модели implicit
phylogenetic network: схема NeighbourNet для италийской, кельтской и германской групп индоевропейской семьи (цит. по: [McMahon & McMahon 2005: 161])

3)
Многомерные модели (предлагаются редко). Четырехмерную модель
(трехмерная сфера с дополнительным измерением, обозначаемым цветом) и.-е. семьи
см. в [Blanchard et al. 2011].

Древесная модель — единственная, которая в полной мере подходит для генеалогической
классификации языков. Вершина дерева — это праязык в момент своего распада.
Промежуточные узлы отражают, соответственно, промежуточные праязыки на момент
их распада. Конечные узлы — языки, на материале которых делается классификация.
Это обычно не эксплицируется, но понятно, что в идеале языковое дерево имеет
прямые исторические соответствия, т. е. вершина и промежуточные узлы — это
временные точки разделения (расселения) конкретных племен — носителей
постулируемых праязыков.

В свою очередь
модель вида network группирует языки по
суммарной схожести параметров. При этом network
принципиально не разделяет сходства между языками, унаследованные от общего
предка, и схождения, приобретенные в результате языковых контактов, таким
образом, близость языков на графической схеме отражает их общие черты, как
исходные, так и вторичные. Строгое разделение на таксоны если и содержится в
графической схеме network, то в очень неявном
виде; обычно схема состоит из нескольких центров притяжения с диффузионными областями
между ними. Почти всегда из графического представления модели вида network читатель не может получить модель древесного
вида.

2. Независимо от того, какой метод подсчетов и какую модель
графической визуализации выберет исследователь, исходным материалом для статистической
обработки служат языковые данные. В случае классификации по лексике — это
лексические списки тех конкретных языков, которые мы вовлекаем в сравнение.

Конечно,
исследователь может составить свои словники для нужных ему языков, однако
большýю популярность имеют уже готовые базы данных для того или иного
набора идиомов. Ср. базу 200-словных списков примерно для ста языков и.-е.
семьи в [Dyen et al. 1997]; аналогичная база для
австронезийской семьи представлена в [Greenhill et al. 2008] (более 800
языков); активно развивается он-лайн проект RefLex, ориентированный на языки африканского континента.

Общим
недостатком всех перечисленных баз данных является отсутствие какой-либо
информации при конкретных формах. Не дается ни точной ссылки на
лексикографический источник, ни полной семантики лексемы (полисемия), ни данных
о сочетаемости слова, ни парадигматической информации, ни обсуждения синонимов,
претендующих на данное значение, но отсеянных составителем. Учитывая, что
семантические критерии отбора слов авторами также никак не эксплицируются[1],
такой первичный материал становится всё менее надежным. Из локальных
недостатков той же базы [Dyen et al. 1997]
отметим известный процент ошибочных форм: напр., в вокабуле ‘to burn (intransitive)’
для части славянских языков приводятся как раз переходные глаголы, производные
от праслав. *paliti (а, скажем, для
иранских языков авторы обычно выбирают непереходную лексему).

3. Новый стандарт составления лексических списков принят в
международном проекте “The Global Lexicostatistical Database” («Лексикостатистическая
база данных языков мира»; в настоящее время готовится к запуску), возглавляемом
Г. С. Старостиным. Задача проекта GLD —
составление и публикация в сети Интернет 110-словных списков базисной лексики
для максимально широкого круга языков. Подача материала принципиально отличается
от баз данных, упомянутых выше. В числе особенностей нового формата списков
можно указать следующее.

1)
Для «слепого» списка английских дефиниций, предложенного
М. Сводешем в середине XX в., нами выработан
строгий семантический стандарт [Kassian et al. 2010], сводящий почти на нет
количество синонимов в конкретных языковых списках.

2)
На основе International Phonetic Alphabet
выработан унифицированный фонетический алфавит для транскрибирования форм в
списке (при этом для языков с национальной письменностью не на основе латиницы
рекомендуется дублировать формы и в традиционной системе письма, скажем, в
кириллице или в иероглифике). Такая стандартизация делает возможным машинный
анализ списков.

3)
При каждом слове указывается точная ссылка на лексикографический источник.

4)
В комментарии к слову дается дополнительная информация о семантике
(случаи полисемии), сочетаемости, прагматике и т. п.

5)
Если на одну позицию претендует несколько слов описываемого языка (напр.
латин. totus и omnis
в одинаковой степени соответствуют сводешевской дефиниции ‘all’),
то выбор одного из слов-кандидатов эксплицитно обосновывается (критериями могут
быть семантические нюансы, сочетаемость, частотность, стилистическая
окрашенность и т. п.).

6)
Для языков, объединенных в одну семью, программа позволяет строить
глоттохронологические деревья в режиме реального времени.

7)
Для языков, объединенных в одну семью, пользователь может непосредственно
через web-интерфейс менять когнации между списками,
получая таким образом новое дерево.

Предполагается, что столь тщательный и строгий отбор первичного материала
позволит существенно повысить уровень точности лексикостатистических подсчетов
в проекте GLD.

4. Известен некоторый методологический «подводный камень», с которым
сталкиваются составители списков базисной лексики.

Как и все
остальные части словаря, список Сводеша, конечно же, меняется с течением
времени. Кроме того, в подавляющем большинстве случаев те идиомы, которые
принято называть диалектами какого-либо языка, обладают различиями в
сводешевском списке, т. е. лексикостатистически являются разными языками.
Из этого следует, что составляемый список базисной лексики должен фиксировать
узко локализованный лингвистический идиом в одной заданной временной точке. В
идеальном случае список должен отражать даже не диалект, а идиолект носителя
(поэтому списки, полученные в результате полевых исследований, особенно ценны)[2].

Особенно остро
указанная проблема встает при попытке составить список базисной лексики
мертвого письменного языка. Если такой язык имеет длительную письменную
традицию (древнегреческий, латинский, аккадский, шумерский) или же его памятники
имеют широкую географическую дистрибуцию, то при формальном выписывании слов с
соответствующими дефинициями из сводного словаря этого языка мы:

1)
не выдерживаем принцип хронологического и диалектного единства;

2)
для языков, хорошо лексикологически представленных (напр., для
древнегреческого), получаем по несколько синонимов для большинства позиций в
списке.

Для мертвых письменных языков методологически правильно было бы
составлять такие списки по текстам какого-либо одного автора (т. е. описывать
идиолект этого автора). К сожалению, в силу скудости дошедших до нас данных для
большинства древних языков такой подход не реализуем. Скажем, древнеегипетский
или шумерский языки представлены значительным корпусом текстов, но ни для
одного, ни для другого нет столь объемного и тематически разнопланового
памятника, чтобы его словник включал в себя если не все 100 сводешевских слов,
то хотя бы их бóльшую часть. Счастливым исключением являются древнекитайский
и классические индоевропейские языки: древнегреческий и латынь. Авторы,
писавшие на этих языках, оставили нам ряд сочинений, пригодных для составления
«монотекстуальных» 100-словных списков.

Ниже в
качестве модельного примера лексикографического стандарта, принятого в проекте GLD, приведен 50-словный[3]
список древнегреческого языка по тексту «Истории» Геродота (V в.
до н. э.). Древнегреческий текст «Истории» дается по [Godley
1920–25]. Цитируемый в статье английский перевод — также по [Godley 1920–25].
Цитируемый русский перевод — по [Стратановский 1972]. При составлении списка
использовался словарь-тезаурус к памятнику: [Powell
1938]. Я ограничил описываемый корпус текстом самого Геродота, т. е. слова
и формы, приводимые Геродотом в цитациях (например, в прямой речи героев «Истории»,
прорицаниях оракулов и т. п.), в общем случае исключались из рассмотрения.

В конце каждой
вокабулы я ввожу поле с названием «Общий древнегреческий», куда помещаются
основные древнегреческие лексемы, засвидетельствованные с соответствующим
значением в каких-либо памятниках этого языка (подбор производился по
англо-древнегреческим словарям [Yonge 1849], [Edwards 1914] и по наиболее авторитетному словарю
древнегреческого языка [LSJ]). Данное поле служит
примером того, с каким количеством синонимов нам пришлось бы столкнуться, если
бы мы пытались составить список для древнегреческого вообще, не ограничиваясь
конкретным автором или хотя бы конкретными диалектом и эпохой.

[1] Почему,
скажем, в [Dyen et al.
1997] для современного русского языка в поле ‘ashes’ подставляется существительное ZOLA,
а не PEPEL? В свою очередь, сводешевское ‘to burn’ авторами интерпретируется как
непереходный глагол (‘гореть’), хотя сейчас принято, скорее, использовать переходный
глагол (‘жечь’), что оправдано, т. к. корень ‘to burn (trans.)’ типологически более устойчив в языках мира и, таким
образом, важнее для списка, нежели ‘to burn (intrans.)’.

[2] Стремление
описывать именно идиолект конкретного носителя не является надуманным. Скажем,
автор настоящей статьи употребляет рус. зола как наиболее
немаркированный, семантически широкий и частотный аналог сводешевского ‘ashes’. Однако, некоторые коллеги автора по проекту GLD —
носители СРЛЯ — подставляют в эту позицию слово пепел. В реальности же в
синхронном языке мы наблюдаем процесс замены старого термина пепел новым
термином зола (пепел приобретает стилистическую окраску или
вытесняется в специализированные значения: пепел сигареты, пепел после кремации).

[3] Ради
экономии места я сократил 110-словный список, принятый в проекте GLD, до
50 его наиболее устойчивых элементов (о выделении этих 50 слов по индексу
стабильности см. [Starostin G. 2010]). В приводимом в статье
списке индекс стабильности указывается подписными цифрами при соответствующем
сводешевском слове (местоимение we₁ —
типологически самый стабильный элемент списка, night₅₀ — наименее стабильный).

Часть 1/3 (см. часть 2, часть 3).

(Добавить комментарий)

sofunja@lj
2011-05-24 17:12 (ссылка)

как учитываются варианты рукописей при таком подходе. Есть ощущение, что это реконструкция реконструкции, ибо античный текст невсегда аутентичен и мог изменяться в средние века. Почему не составлять списки по векам, сравнивая результаты различных авторов одной эпохи, что дает предпочтение одного автора? Почему выбор сделан в пользу англоязычных словарей?

(Ответить) (Ветвь дискуссии)

kassian@lj
2011-05-24 17:21 (ссылка)

Рукописи (их несколько десятков, как ты знаешь) учтены издателями. В словаре Пауэлла отмечаются расхождения. Всё, что я видел, это несущественные для моего исследования расхождения в фонетике (малочисленные). Конечно, не помешало бы иметь полноценное дипломатическое издание Геродота, но такового нет, насколько я знаю.

А какие еще бывают словари? Я хороших словарей с XYZ на др.-греческий не знаю. Лучшее, что нашел -- это два указанных (хотя они и устаревшие, но для моей задачи вполне подходят). Русский словарь Черного не выдерживает критики (скажем, слова "вошь" там нет, ибо не правильно смущать институток).

P.S. Новый русско-древнегреческий словарь не помешало бы иметь. Задача простая и техническая -- сделать аннотированный обратник к LSJ. Но почему-то из всей прорвы русских классиков за это никто не берется.

(Ответить) (Уровень выше) (Ветвь дискуссии)

ballilogh@lj
2011-05-25 04:00 (ссылка)

Очень интересный доклад, спасибо большое.
А насчет классиков и обратного словаря: так они, по большей части, теоретическую лингвистику по-старинке не жалуют, они и на индоевропеистику-то смотрят искоса. Вон, в воспоминаниях Федорова (латинист, меня учил латыни) http://www.rsuh.ru/article.html?id=686 (внизу, не помню в какой статье), описывается, как все старшее поколение классиков (Радциг, Попов -последний, правда, был директором гимназии, а не ученым) воротило носы от теоретической, да и вообще новейшей лингвистики, считая все это "глупостями".
Я вот вспомнил, что кроме Черного были еще несколько словарей рус.-дргреч - Поспишиля и Коссовича (последний, по-моему, есть в ленинке в зале №3 в свободном доступе), но это Вы правы - все устарело безнадежно. Да, обратник Лиддел=Скотта - мысль отличная, его м.б. помножить на Шантреновский словарь. Кстати, есть ведь словари к отдельным авторам, тоже небесполезно.
Еще раз - спасибо за статью, оч. интересно.
Со всем уважением
Армен

(Ответить) (Уровень выше) (Ветвь дискуссии)

kassian@lj
2011-05-25 04:30 (ссылка)

Рад был быть полезен.

Я бы не сказал, что составление русско-др.-греческого словаря -- это настолько уж из области теоретической лингвистики.

Кстати, как показала практика, для базисной лексики связка Yonge 1849 (больше синонимов, но и сильнее устаревшая база) и Edwards 1914 (более краткий, но новее) покрывает всё, что нужно. Проверка сплошным поиском английских дефиниций по LSJ ничего особенно нового не дает.

Конечно, в случае более изысканных и сложных значений (напр., "любовь") Yonge 1849 и Edwards 1914 могут что-то пропускать. Но есть ведь достаточно аккуратно распознанный LSJ по Либроникс. Можно по нему искать. Распознан он действительно неплохо. Скажем, в работе над 110-словным списком мне в эл. версии LSJ в заголовочных словах попалась всего одна опечатка (ударение где-то неправильное стояло).

(Ответить) (Уровень выше) (Ветвь дискуссии)

ballilogh@lj
2011-05-25 06:24 (ссылка)

А, я в том смысле, что типичный ответ классиков на такие идеи (типа составления русско-др.греч. словаря): "А зачем? Спецы, типа, и так все знают, а кому надо - тот пусть и делает".
Про теор. лингв. я в смысле, что обычно классики очень себя ограничивают (либо классический аттический+письменность на нем, т.е. больше чистой филологии и лит-ведения, либо латынь).
А так, повторюсь, идея Ваша нужная. Подумаем, может чего-нибудь сделаем вместе? Я - за.

(Ответить) (Уровень выше) (Ветвь дискуссии)

	kassian@lj 2011-05-25 07:27 (ссылка)
	Ох нет, боюсь, на такие проекты точно не получится выделить времени. (Ответить) (Уровень выше) (Ветвь дискуссии)

	ballilogh@lj 2011-05-25 08:33 (ссылка)
	OK (Ответить) (Уровень выше)

sofunja@lj
2011-05-25 17:31 (ссылка)

Есть хорошие немецкие (W. Pape и т.п.) и французские словари (A. Bailly и т.п.), правда, большая их часть с греческого на современный язык, Pape есть в виде пдф. В Париже пользовалась и обратниками хорошими, но не помню авторов.
Рукописи не всегда учитываются в полном объеме и все. К тому же возникает вопрос, если мы будем двигаться по времени дальше и составлять соответствующие 110 словники, насколько правомерно будет сравнение идиолектов авторов разных жанров и видов литературы. Или Геродота мы теперь сравниваем только с историками. Еще отдельный вопрос, насколько авторы показывают современный им слой языка, а не щеголяют устаревшими словами или их диалектными аналогами для создания колорита, образа и т.п.
ты один из вопросов пропустил, повторяю: Почему не составлять списки по векам,
> сравнивая результаты различных авторов одной эпохи, что дает предпочтение
> одного автора?

(Ответить) (Уровень выше) (Ветвь дискуссии)

	kassian@lj 2011-05-25 17:41 (ссылка)
	У Pape я знаю только "Griechisch-Deutsch". У Bailly - grec-francais. Но речь о словарях в обратном направлении. P.S. На пропущенный вопрос не ответил, потому что всё же в докладе расписано. (Ответить) (Уровень выше) (Ветвь дискуссии)

sofunja@lj
2011-05-26 03:16 (ссылка)

то, что написано в докладе, я прочитала, но меня не убедило. Возникает практический вопрос: как дальше реализовывать процедуру. Вот список Геродота, с чем ты будешь его сравнивать? Как учитывать при этом особенности, которые накладывает жанр и вид литературы или все сравнения внутри жанра и вида лит-ры? Как определять когда один фрагмент отделился от другого? Где гарантия, что слово, которое ты выделил как базовое, не употреблено в переносном смысле, если учесть, что часто в переводах литературные приемы переводятся небуквально?
Если говорить о современном языке, у нас есть же 3 списка, они почти идентичны, хотя их заполняли носители отдельно друг от друга и разного бэкграунда. Как с ними сравнивать полученные тобой результаты?

(Ответить) (Уровень выше)

	ingvarr_79@lj 2011-05-25 08:05 (ссылка)
	Благодарю, интересно. (Ответить)

fbmk@lj
2011-05-25 14:06 (ссылка)

Я не читал специальных статей, на которые ты ссылаешься (например, Nichols & Warnow 2008). Возможно, с ними стало бы ясно.
Но из краткой преамбулы (понятно, что это несущественная часть статьи) неясно, почему общетипологические матрицы используются реже. Может быть, матрица это что-то специальное? Обычная типологическая работа с набором параметров и выяснением корреляции между ними (например, работы по порядку слов - Гринберг, Драйер и т.п.) - это что-то иное? Или та же книга Николз 1992 г. (которая, вероятно, упоминается в ее статье)?

(Ответить) (Ветвь дискуссии)

kassian@lj
2011-05-25 14:22 (ссылка)

Да, это оно и есть. Простой набор бинарных или тернарных грамматических характеристик.
Употребляется реже, подозреваю, потому что очевидна слабость и необязательность получаемых выводов.
Хотя некоторые типологи полагают, что при увеличении матрицы (сотни признаков) доказательная сила метода возрастет. Это в частности обсуждается в дискуссионной статье [Соловьев 2010] с отвестами А.В. и Гоши.

P.S. С выходом WALS кол-во таких работ, разумеется, увеличилось. Удобнее матрицу заполнять стало.

(Ответить) (Уровень выше) (Ветвь дискуссии)

	fbmk@lj 2011-05-25 16:48 (ссылка)
	WALS вроде вышел в 2008 году, т.е. совсем недавно утверждение, что таких работ меньше, содержится в Соловьев 2010? (Ответить) (Уровень выше) (Ветвь дискуссии)

kassian@lj
2011-05-25 16:56 (ссылка)

Нет, это мое утверждение. Использование типологических матриц с последующей формальной обработкой и рисованием красивой схемы встречается редко AFAIK.

Соловьев 2010 наоборот сторонник такого типологического подхода.

(Ответить) (Уровень выше) (Ветвь дискуссии)

fbmk@lj
2011-05-25 17:09 (ссылка)

Он кажется сторонник экзотической разновидности типологического подхода, в соответствии с которым типологическая матрица нужна для сравнительно-исторических целей. Видимо, идет эта идея от Николз, но вроде не за это Николз ценят.

Обычно как раз наоборот - для типологической работы нужно снять генетические сходства как шум (как у Драйера).
Драйер использовал большие выборки задолго до всякого WALS. Да и Хокинз.

(Ответить) (Уровень выше) (Ветвь дискуссии)

	kassian@lj 2011-05-25 17:16 (ссылка)
	Не спорю ни разу. Вообще спасибо, у меня некоторые формулировки не вполне аккуратны. Надо будет при случае подправить. (Ответить) (Уровень выше)

fbmk@lj
2011-05-25 17:43 (ссылка)

>Соловьев 2010 наоборот сторонник такого типологического подхода.
не думаю, что содержательная оценка напрямую коррелирует с количественной

Например, если бы ты наверняка знал, что подобных типологических работ больше, это не сделало бы тебя их сторонником и никак не склоняло бы читателя в сторону таких работ (не то чтобы всегда больше хороших работ, скорее наоборот).

(Ответить) (Уровень выше) (Ветвь дискуссии)

kassian@lj
2011-05-25 17:50 (ссылка)

В смысле?
У меня совершенно безоценочный (и беглый) обзор. У меня нет цели перечислить всю лит-ру за последние 30 лет. Цель -- обозначить актуальную расстановку сил. Факт, что чисто типологических работ по статистической классификации языков (генеалогической или ареальной) меньше, нежели лексикостатистических.

(Ответить) (Уровень выше) (Ветвь дискуссии)

	fbmk@lj 2011-05-25 17:57 (ссылка)
	Конечно. Это было только замечание к твоему "наоборот". Мне показалось, что оно содержит странную логику. (Ответить) (Уровень выше)

fbmk@lj
2011-05-25 18:01 (ссылка)

По сути, пожалуй, больше всего смущает не количественная оценка, а список целей
Так как среди целей не рассматривается собственно изучение типологических корреляций (для которых генетические и ареальные черты - не цель изучения, а шум, который нужно погасить), возникает подозрение, что учитывается лишь какое-то подмножество возможных матриц.
Например, корреляция предлогов/послелогов и порядка OV ~ VO.

(Ответить) (Ветвь дискуссии)

kassian@lj
2011-05-25 18:14 (ссылка)

Понимаю, о чем ты. Но ты сейчас говоришь о корреляциях внутри одной матрицы (т.е. внутри одного языка). А я пишу об исследованиях, посвященных корреляциям между языками (родственные слова, общие фичи).

(Ответить) (Уровень выше) (Ветвь дискуссии)

	fbmk@lj 2011-05-25 18:17 (ссылка)
	Вот-вот. Мне кажется, именно эта граница не вполне ясно эксплицирована вначале (хотя потом из списка целей она становится ясна). (Ответить) (Уровень выше) (Ветвь дискуссии)

kassian@lj
2011-05-25 18:26 (ссылка)

Это ж планировалось как доклад перед классическими индоевропеистами (русскоязычными)! Тут бы и так наступил overflow O_o

Но в более полном обзоре всё это надо будет прописать, ты прав. Обращусь тогда к тебе за лит-рой.

(Ответить) (Уровень выше)

Упс

kassian@lj
2011-05-29 16:06 (ссылка)

Я сейчас перечитал начало своего текста и, наконец, понял, почему ты так среагировал. Я писал обзор подходов к классификации языков (генеалогической, ареальной, любой). Но во введении я это эксплицитно не прописал. Недосмотр и небрежность, признаЮ.

(Ответить) (Уровень выше) (Ветвь дискуссии)

Re: Упс

fbmk@lj
2011-05-29 16:23 (ссылка)

Ага. Современные типологи обычно, видимо, не ставят перед собой цель классифицировать языки в целом (только конкретные языковые черты).

Именно языки в целом классифицировал Климов. Но это, конечно, скорее курьез (хотя и достаточно необычный для советской науки - у него ссылок на западные книги заметно больше, чем на советские, причем среди советских, с определенными оговорками, но не может не цитировать классика этого направления, то бишь Марра).

(Ответить) (Уровень выше)

	severmoroz@lj 2011-05-30 08:55 (ссылка)
	http://www.newsland.ru/news/detail/id/702622/cat/69/ ))))))))))))))) (Ответить) (Ветвь дискуссии)

	kassian@lj 2011-05-30 10:02 (ссылка)
	Вполне жирненько. Жукова маладца. (Ответить) (Уровень выше)