Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет kassian ([info]kassian)
@ 2013-05-09 17:35:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
A. Kassian (Institute of Linguistics of the Russian Academy of Sciences)


On Pagel et al. 2013: inaccurate input data and incorrect methods lead to unreliable results

Отклик на статью:

Mark Pagel, Quentin D. Atkinson, Andreea S. Calude, Andrew Meade (edited by Colin Renfrew). ‘Ultraconserved words point to deep language ancestry across Eurasia’. In: PNAS May 6, 2013, doi: 10.1073/pnas.1218726110.
Main text: http://www.pnas.org/content/early/2013/05/01/1218726110.full.pdf+html?with-ds=yes
Supporting Information: http://www.pnas.org/content/suppl/2013/05/01/1218726110.DCSupplemental

В статье Pagel et al. 2013 лексикостатистически обосновывается существование ностратической макросемьи, предлагается укорененное и датированное дерево, построенное методом MCMC, а также делается утверждение о прямой зависимости частоты употребления слова и временем его жизни в языке. Авторы используют 200-словный (точнее, 188-словный) список Сводеша, сравнивая не засвидетельствованные языки, а семь реконструированных праязыков семей, входящих в ностратическую макросемью.

1. Составление лексикостатистической матрицы и семантическая реконструкция
2. Частотность употребления и выделение базисных значений
3. Мелочи
4. Выводы




1. Составление лексикостатистической матрицы и семантическая реконструкция


Pagel et al. (2013) целиком и полностью опираются на этимологические базы данных проекта Tower of Babel (далее: LWED), не используя никаких дополнительных лексикографических источников. Вслед за текущей версией LWED авторы объединяют в ностратическую макросемью 7 языковых семей Старого Света:
1) индоевропейская
2) уральская
3) алтайская
4) картвельская
5) дравидийская
6) чукотско-камчатская
7) эскимосская

Прежде всего следует указать, что текущие версии баз некоторых из указанных семей представляют собой достаточно сырой продукт: в первую очередь это касается индоевропейской, уральской, чукотско-камчатской и эскимосской баз.

Во-вторых, сама ностратическая база (т.е. предполагаемые связи между пракорнями в базах индивидуальных семей) представляет собой чрезвычайно предварительный этап исследования. По сути, сегодняшняя версия ностратической базы является «сборной солянкой», куда включены этимологии из публикаций В.М.Иллич-Свитыча, этимологии из незавершенного «Nostratic Dictionary» А.Б.Долгопольского, а также не систематические добавления, сделанные в разное время С.А.Старостиным, Е.А.Хелимским, А.В.Дыбо и многими другими лингвистами Московской школы. В настоящее время мы (А.В.Дыбо, М.А.Живлов, Г.С.Старостин и я) производим ревизию ностратической базы, и, вероятно, новая версия базы будет доступна через несколько лет.

Та или иная степень предварительности вышеуказанных этимологических материалов достаточно очевидна лингвисту.

Отдельную проблему составляет реконструкция значений. Pagel et al. (2013) не занимаются семантической реконструкцией, беря те значения пракорней, которые предлагаются в этимологических базах проекта LWED. К сожалению, Pagel et al. (2013) не поняли принципа, по которому реконструируются значения не во всех, но в большинстве баз LWED. Принцип следующий: в поле Proto-meaning выносятся все синхронно засвидетельствованные значения, т.е. авторы базы декларируют, что на данном этапе исследования они отказываются от детальной семантической реконструкции, но зато каталогизируют отмеченные значения.

Напр., в монгольской базе отмечены 4(!) прамонгольские основы с анатомическим значением ‘голова’:
*teriɣün ‘head; before, first’,
*heki ‘head; front’,
*tolugai ‘head’,
*taraki ‘brain, mind; head’

Это не значит, что авторы Etymological Dictionary of Altaic Languages предлагают постулировать четыре синонима для ‘головы’, сосуществовавших в праязыке; авторы всего лишь оставляют семантическую реконструкцию «на потом».

Pagel et al. (2013) работают с лексикостатистической матрицей (файл st01.docx), которая составлена следующим образом. Для каждой из семи рассматриваемых языковых семей (индоевропейская, уральская, алтайская, картвельская, дравидийская, чукотско-камчатская, эскимосская) выписываются все корни, которые в базах LWED реконструируются с данным значением. Например, в слоте ‘ASHES’ выписываются все и.-е., все уральские, все алтайские и т.д. пракорни, которые имеют глоссу ‘ASHES’ в поле Proto-meaning в базах LWED.

Таким образом, мы получаем несколько и.-е. пракорней ‘ASHES’ и несколько уральских пракорней ‘ASHES’. Если какой-нибудь из этих и.-е. корней имеет этимологическое соответствие в виде одного из вышеупомянутых уральских корней, то в слоте ASHES мы ставим плюс (у авторов знак «1») между и.-е. и уральским. Если ни один из и.-е. пракорней ‘ASHES’ не имеет этимологических когнатов со значением ‘ASHES’ в остальных семьях, то и.-е. материал элиминируется, и в слоте ‘ASHES’ у и.-е. языка будет стоять «0».

Иногда для одной семьи Pagel et al. (2013) могут реконструировать несколько слов с одинаковым значением. Напр., для ‘TO BURN’ в и.-е. семье берется аж четыре корня, т.к. каждый из них имеет этимоны с этим же значением в какой-либо другой семье (уральской, алтайской и т.д.).

К сожалению и по непонятной причине, Pagel et al. (2013) не перечисляют собственно реконструированных корней, которыми они оперируют! Вместо этого читателю доступна только итоговая лексикостатистическая матрица между семью праязыками, заполненная «1» и «0» (файл st01.docx). Впрочем, обычно конкретные пракорни можно вычислить при помощи определенных манипуляций с базами LWED.

Подчеркнем, что при установлении этимологических когнаций Pagel et al. (2013) следуют именно разметке в текущей версии баз LWED и не используют каких-либо формализованных алгоритмов.

Что в результате представляет собой их лексикостатистическая матрица? Это попытка семантической реконструкции для праязыков уровня семьи. Т.е. когда Pagel et al. (2013) отбирают из нескольких индоевропейских корней ‘ASHES’ один (по указанному выше критерию внешней этимологии), то подразумевается, что именно этот корень служил для выражения ‘ASHES’ в индоевропейском праязыке.

Семантическая реконструкция — плохо разработанная область компаративистики. Ее методология и инструментарий пока не до конца сформировались. Более того, необходимость точных реконструкций значений довольно плохо осознается в мировой лингвистике. Видимо, сегодня наиболее последовательными пропонентами строгого подхода к семантике являются представители Московской школы компаративистики. А, скажем, типовым для современной западной индоевропеистики является подход к семантике а-ля Покорный (в знаменитом словаре праиндоевропейских корней Ю.Покорного, по подсчетам А.В.Дыбо, ок. 70% корней реконструировано со значением ‘раздуваться’ или ‘сгибать(ся)’!).

Наиболее точным и надежным подходом к семантической реконструкции является метод семантических решеток, развитый и апробированный на материале тюркских, монгольских, тунгусо-маньчжурских и иранских языков в монографии А.В.Дыбо «Семантическая реконструкция в алтайской этимологии: Соматические термины (плечевой пояс)» (М., 1996).

Метод семантических решеток обладает двумя существенными недостатками. Во-первых, он крайне трудоемкий. Обработать значимую часть словаря теми силами, которые есть у лингвистов хоть в России, хоть на Западе, за разумный отрезок времени затруднительно. Второе, что важнее, такая работа имеет смысл, когда у нас имеются надежные и подробные синхронные словари для большинства исследуемых языков. А это редкость за пределами индоевропейской семьи.

Возможен, однако, другой подход, который позволяет значительно быстрее реконструировать праязыковое значение при незначительном снижении достоверности. Основные принципы такого подхода были коллегиально выработаны Георгием Старостиным, Михаилом Живловым и мной в рамках работы над проектом «The Global Lexicostatistical Database». Эти принципы были последовательно применены мною при реконструкции пралезгинского списка Сводеша и эксплицитно сформулированы и проиллюстрированы в моем недавнем докладе «The Lezgian linguistic group within the framework of the Global Lexicostatistical Database»:
1) Топологический критерий. Исходя из построенного лексикостатистического дерева, мы реконструируем то значение, которое совместно с конкурирующими значениями требует наиболее простого сценария.
2) Внешний этимологический критерий. Из конкурирующих значений имеет преимущество то, которое поддерживается внешней этимологией.
3) Внутренний этимологический критерий. Если на некоторое значение претендует две праосновы — одна морфологически непроизводная, а вторая производная, — преимущество имеет первая, а вторая, скорее, является новообразованием.
4) Семантический критерий. Большинство семантических переходов двусторонние, но совсем не все: многие переходы возможны только в одном направлении.
5) Ареальный критерий. Если один из кандидатов характерен для определенной территории, а второй, напротив, фиксируется на несмежных территориях, то первое слово, возможно, является ареальной инновацией.

Оказывается что Pagel et al. (2013) неявно, но используют всего лишь один и только один из названных принципов: критерий внешней этимологии. Спору нет, это важный критерий, и нередко именно он является решающим. Однако ясно, что он не главный. На мой взгляд, методологически очевидно, что в общем случае внутренние критерии приоритетнее.

К чему же приводит рецензируемых авторов механистическое применение внешнеэтимологического критерия? Рассмотрим некоторые примеры.

Слот ‘ASHES’. Pagel et al. (2013) в своей лексикостатистической матрице указывают, что существует ностратический корень, сохраняющийся в этом значении в 4 семьях: индоевропейской, уральской, алтайской и эскимосской. Как я уже говорил, сами корни авторы не приводят, но, что именно имеется в виду, можно попробовать вычислить.

В индоевропейской базе обнаруживаются 3 корня с глоссой ‘ashes’ (что, как указано выше, означает наличие значения ‘ASHES’ хотя бы в одной из групп внутри и.-е. семьи):
1) *ken- ‘ashes’
2) *pelǝ- ‘dust; ashes’
3) *xas- ‘to burn, to dry; hearth; ashes’

В уральской базе обнаруживаются 3 корня с глоссой ‘ashes’:
1) *kuδ́mV ‘ashes’
2) *konV ‘ashes; lye’
3) *pelme ‘dirt; dust; ashes’

В алтайской базе обнаруживаются 6 корней с глоссой ‘ashes’:
1) *č`ṓga ‘ashes; glowing coals’
2) *k`i̯āla ‘hot; ashes’
3) *k`i̯ŭ̀ru(mV) ‘ashes; soot’
4) *pép`à ‘dust; ashes’
5) *p`oĺńe ‘ashes; grey’
6) *ǯi̯àjnà ‘to burn; ashes; tar’

В эскимосской базе обнаруживаются 5 корней с глоссой ‘ashes’:
1) *paɣu-la ‘soot; ashes; dirt’
2) *palqǝ ‘ashes; hot; dry’
3) *panǝ-ʁ- ‘to burn; ashes; to dry out; to become skinny’
4) *pǝlu- ‘dust; ashes; clod’
5) *aʁra ‘ashes; powder’

В ностратической базе восстанавливается корень *ṗVlV ‘grey; ashes’, который действительно объединяет в себе и.-е. *pelǝ-, уральск. *pelme, алтайск. *p`oĺńe, эскимосск. *palqǝ. В соответствии с принципом внешней этимологии Pagel et al. (2013) полагают, что именно эти корни выражали значение ‘ASHES’ в соответствующих праязыках, и заносят эту изоглоссу между четырьмя праязыками в матрицу.

Давайте взглянем подробнее, насколько оправдана такая семантическая реконструкция.

Алтайский. Видимо, только для праалтайского есть резон постулировать *p`oĺńe как праалтайский термин для ‘ASHES’ (см. базу). В первую очередь здесь играет роль топологический критерий: это бесспорный прамонгольский (*hüne-sü) и пратунгусо-маньчжурский (*pulńe-) термин для ‘ASHES’, а в пратюркском он сохранился как цветообозначение (*oń ‘grey, dun, ash-coloured’).

Все остальные алтайские основы, выписанные выше, — намного более слабые кандидаты на статус праалтайского термина ‘ASHES’. А, например, для *č`ṓga и *k`i̯āla вообще, строго говоря, нигде не фиксируется синхронное значение ‘ASHES’.

Хуже обстоит дело в других семьях.

Индоевропейский. Главный и бесспорный кандидат на статус праиндоевропейского термина ‘ASHES’ — это *xās. Он отмечен как основной термин для ‘ASHES’ в анатолийской группе и во многих группах узкоиндоевропейской ветви (др.-индийск., иранск., армянск., германск.). Иногда этот корень отмечается в значении ‘hearth; altar’ или в глагольной функции ‘to dry up’ (LIV2: 257). Это, однако, не препятствует реконструкции и.-е. *xās ‘ASHES’.

И.-е. *ken- является основным корнем для ‘ASHES’ только в италийской группе и не может претендовать на прастатус.

Аналогично и важный для Pagel et al. (2013) корень *pelǝ- значит ‘ASHES’ только в балто-славянской группе, а в других группах имеет иную, хотя и близкую семантику, напр., др.-греческ. πάλη ‘fine flour, fine dust’, латинск. pollen ‘finely ground flour’. Надо отметить, что в значении ‘ASHES’ зафиксированы только производные формы с этим корнем: формы множественного числа от суффигированной основы *pel-en-V ‘ASHES’ в балтийских и редупликация *pepelъ/*popelъ ‘ASHES’ в славянских. Дистрибуция этого корня и морфологическая производность соответствующих основ показывают, что нет никаких оснований постулировать *pelǝ- с праиндоевропейским значением ‘ASHES’.

Уральский. Топологически лучшим кандидатом на статус прауральского термина ‘ASHES’ является *kuδ́mV, который засвидетельствован в этом значении в мордовских, обско-угорских и, вероятно, самодийских (самодийск. *kimä ‘ASHES’, по предложению Е.А.Хелимского).

Второй кандидат — *konV, но он фиксируется только в финно-пермской ветви (где значит ‘ASHES; lye’) и поэтому менее предпочтителен.

Третий и важный для Pagel et al. (2013) корень *pelme — еще более слабый кандидат, т.к. в значении ‘ASHES’ он фиксируется только в пермской группе (а в прибалтийско-финских он обозначает скорее что-то вроде ‘dirt’).

Эскимосский. Здесь бесспорный кандидат на статус праэскимосского термина ‘ASHES’ — это основа *aʁra, которая является основным словом для ‘ASHES’ в значительной части и юпикских, и инуитских диалектов. Для всех остальных четырех эскимосских основ, перечисленных выше (в том числе *palqǝ и *pǝlu-), значение ‘ASHES’ фиксируется только спорадически в том или ином диалекте, где его можно считать производным от значений ‘dust’, ‘to burn’ и т.п.

Таким образом, вместо лексикостатистического соответствия в слоте ASHES между четырьмя семьями (как то выписано у Pagel et al. 2013) мы обязаны констатировать, что в слоте ASHES мы не имеем ни одного лексикостатистического соответствия.

NB: это не значит, что ностратическая этимология *ṗVlV (и.-е. *pelǝ-, уральск. *pelme, алтайск. *p`oĺńe, эскимосск. *palqǝ, а также дравидийские и картвельские формы) неверна. Но как лексикостатистическое совпадение она расценена быть не может, т.к. только для праалтайского рефлекса мы можем предполагать собственно значение ‘ASHES’.


Слот EYE. Pagel et al. (2013) в своей лексикостатистической матрице указывают, что существует ностратический корень, сохраняющийся в этом значении в 2 семьях: алтайской и дравидийской. Попробуем вычислить, какой именно корень имеют в виду авторы.

В алтайской базе обнаруживается ровно 1 корень с анатомической глоссой ‘eye’:
1) *ni̯ā̀ ‘eye’

Это очень стабильный праалтайский корень, сохраняющийся в базовом значении ‘eye’ во всех группах, кроме тюркской (в пратюркском *göŕ 'EYE' -- новообразование от глагола 'to see').

В дравидийской базе обнаруживаются 2 корня с глоссой ‘eye’:
1) *kaṇ- ‘eye’
2) *nō- ‘view, to notice, eye’

Из них *kaṇ- — бесспорный кандидат на статус прадравидийского термина ‘EYE’. Это очень стабильный корень, сохраняющийся в базовом значении ‘eye’ во всех группах.

Напротив, дравидийск. *nō- (который Pagel et al. 2013 лексикостатистически линкуют с алтайск. *ni̯ā̀) фиксируется только в южнодравидийской группе, где он имеет глагольное значение ‘to look at, examine’, а некоторые именные девербативы действительно глоссируются как ‘eye’, но, видимо, они никогда не употребляются в анатомическом значении, а выражают действие ‘eye, eyesight, look, gaze, glance, view’.

Таким образом, вместо лексикостатистического соответствия в слоте EYE между двумя семьями (как то выписано у Pagel et al. 2013) мы обязаны констатировать, что в слоте EYE мы не имеем ни одного лексикостатистического соответствия.


Слот STAR. Pagel et al. (2013) в своей лексикостатистической матрице указывают, что существует ностратический корень, сохраняющийся в этом значении в 3 семьях: индоевропейской, уральской и дравидийской. Попробуем вычислить, какой именно корень имеют в виду авторы.

В индоевропейской базе обнаруживаются 2 корня с глоссой ‘star’:
1) *xster- ‘star’
2) *ǵ(h)ʷeisd(h)- ‘star’

В уральской базе обнаруживаются 2 корня с глоссой ‘star’:
1) *kuńćV ~ *kućV ‘star’
2) *täštä ‘sign; star’

В дравидийской базе обнаруживаются 2 корня с глоссой ‘star’:
1) *Cuk- ‘star’
2) *min_- ‘to lighten; spark; star’

В ностратической базе восстанавливается корень *ḳʷVncwxV ‘star, spark’, который действительно объединяет в себе и.-е. *ǵ(h)ʷeisd(h)-, уральск. *kuńćV ~ *kućV, дравидийск. *Cuk-. В соответствии с принципом внешней этимологии Pagel et al. (2013) полагают, что именно эти корни выражали значение ‘ASHES’ в соответствующих праязыках, и заносят эту изоглоссу между тремя праязыками в матрицу.

Давайте взглянем подробнее, насколько оправдана такая семантическая реконструкция.

Индоевропейский. Бесспорный кандидат на статус праиндоевропейского термина ‘STAR’ — это *xster-. Он отмечен как основной термин для ‘STAR’ в анатолийской группе и фактически во всех многих группах узкоиндоевропейской ветви (тохарск., др.-индийск., иранск., греческ., армянск. и т.д.).

Важный для Pagel et al. (2013) корень *ǵ(h)ʷeisd(h)- значит ‘STAR’ только в балто-славянской группе (балтск. *ǯwaĩžd-iā̃, славянск. *gvēzda). За пределами балто-славянской группы *ǵ(h)ʷeisd(h)- не отмечен, а сама форма корня указывает или на морфологическую производность или вообще на иноязычное происхождение. Так или иначе, *ǵ(h)ʷeisd(h)- не может быть постулирован как праиндоевропейский термин ‘STAR’.

Уральский. Топологически надежным кандидатом на статус прауральского термина ‘STAR’ действительно является тот корень, который используют Pagel et al. (2013): *kuńćV ~ *kućV. Он засвидетельствован в этом значении и в угорской, и в финно-пермской, и в самодийской группах.

Второй кандидат — *täštä — фиксируется только в финно-волжских, где явно является инновацией неясного происхождения.

Дравидийский. Выбор между двумя корнями *Cuk- и *min_- не до конца ясен, потому что топологически они пересекаются: *Cuk- значит ‘STAR’ в телугу и центральнодравидийских, а *min_- значит ‘STAR’ в севернодравидийских и южнодравидийских.

Так как основная функция *min_- глагольная со значением ‘to lighten, flash’, хочется думать, что семантика ‘STAR’ — независимая деривация в севернодравидийских и южнодравидийских. Тогда *Cuk- оказывается прадравидийским корнем ‘STAR’. Альтернативное решение: считать *min_- ‘STAR’ уже прадравидийской отглагольной деривацией, а телугу и центральнодравидийск. *Cuk- оказывается независимой(?) инновацией неизвестного происхождения.

Таким образом, вместо лексикостатистического соответствия в слоте STAR между тремя семьями (как то выписано у Pagel et al. 2013) мы можем с натяжкой постулировать бинарное совпадение между уральск. *kuńćV ~ *kućV ‘star’ и дравидийск. *Cuk-. Со строго формальной точки зрения, однако, лучше от этого сравнения отказаться, т.к. чтобы эти формы были фонетически совместимы, для дравидийск. *Cuk- надо предполагать окказиональную консонантную метатезу. Собственно, в ностратической базе, где восстанавливается корень *ḳʷVncwxV ‘star, spark’, дравидийская параллель *Cuk- дается под знаком вопроса, что было проигнорировано Pagel et al. (2013).

Можно подвести итоги. Я взял три фактически первых попавшихся слова из лексикостатистической матрицы Pagel et al. (2013). Как было продемонстрировано выше, сближения, которые используют Pagel et al. (2013) по большей части неправомерны. Более того, ‘ASHES’, ‘EYE’, ‘STAR’ — сверхустойчивые элементы списка Сводеша (об индексе стабильности см. С. Старостин 2007a; G. Starostin 2010), т.е. их реконструкция должна вызывать значительно меньшие трудности, чем реконструкция многих других сводешевских элементов. Бегло просмотрев оставшуюся часть лексикостатистической матрицы Pagel et al. (2013), я готов утверждать, что бóльшая часть внесенных в нее сближений некорректна.



2. Частотность употребления и выделение базисных значений


В середине XX в. Моррис Сводеш сформулировал список из 100 понятий, слова для которых, по его мнению, универсально являются наиболее устойчивыми как к семантическим и лексическим заменам, так и к заимствованиям (об уточнении семантики сводешевских слов см. Kassian et al. 2010). Дальнейшие исследования показали, что Сводеш был прав и его список действительно можно считать лексическим ядром человеческого языка (по крайне мере, это касается коммуникации в традиционном обществе). Наверное, список можно было бы уточнить, например, изъять некоторые понятия, включив вместо них другие, но в целом сводешевский 100-словник остается универсальным и единственным формальным инструментом генеалогической классификации языков (скажем, я бы исключил из списка слово ‘SEED’ как обычно культурно обусловленное и слово ‘PERSON’ как предполагающее высокую степень абстракции).

Интригующим вопросом является то, почему именно эти сто значений являются для языка ядерными? Интуитивный ответ — эти слова наиболее частотны в повседневной речи членов традиционного общества (см., например, такое предположение в Haspelmath 2008: 50). Проверить это, однако, не представляется возможным, т.к. у лингвистов на сегодня нет таковых текстовых корпусов. Имеющиеся корпуса обычно описывают письменный литературный язык индустриального или постиндустриального общества. И даже если в корпус включены разговорные фрагменты или фольклорные тексты, это не то же самое, что последовательная транскрипция всех реплик типового представителя традиционного общества в течение, скажем, одной недели.

Pagel et al. (2013), однако, оперируют понятием частоты использования слова, предполагая прямую корреляцию между устойчивостью слова в течение развития языка и частотой его употребления (чем частотнее слово, тем дольше оно живет в языке). Как я уже сказал выше, интуитивно это предположение кажется правильным. Однако Pagel et al. (2013) претендуют на строгую доказанность этой взаимосвязи. Основанием для их уверенности служат предыдущие публикации этого же коллектива авторов:
1) Mark Pagel, Quentin D. Atkinson, Andrew Meade. Frequency of word-use predicts rates of lexical evolution throughout Indo-European history. In: Nature, Vol 449, 11 October 2007, doi:10.1038/nature06176
2) Andreea S. Calude, Mark Pagel. How do we use language? Shared patterns in the frequency of word use across 17 world languages. In: Phil. Trans. R. Soc. B 2011, 366, doi: 10.1098/rstb.2010.0315

Pagel et al. (2007) работают на материале корпусов 4 языков индоевропейской семьи, а в Calude & Pagel 2011 расширяют список до 17 языков, причем выходят за рамки индоевропейской семьи. Например, в Pagel et al. 2007 используются следующие четыре корпуса: английский (British National Corpus), испанский (Corpus del español), русский (Большой корпус русского языка) и новогреческий (Hellenic National Corpus).

Вывод Pagel et al. 2007 и Calude & Pagel 2011: для индоевропейских языков внутри сводешевского 200-словника частота употребления слова обычно прямо коррелирует с длительностью «жизни» этого слова в языке.

Во-первых, остается открытым более интересный вопрос: а действительно ли сводешевские слова (пусть даже не из 100-словника, а из 200-словника) самые частотные в языке или нет?

Во-вторых, несмотря на интуитивную привлекательность выводов Pagel et al. 2007 и Calude & Pagel 2011, нельзя не высказать следующие критические замечания.

1) Нельзя исследовать такие зависимости на материале языков одной семьи (в данном случае индоевропейской), т.к. устойчивость слова, вообще говоря, связана с тем, насколько старым и «истершимся» оно уже было в праязыке. Например, в индоевропейских языках крайне неустойчиво слово ‘TAIL’ (даже для праславянского очень трудно обоснованно выбрать пракорень из засвидетельствованных вариантов обозначения хвоста, см. Саенко в печати). Однако при этом типологически ‘TAIL’ входит в первые три десятка самых стабильных сводешевских слов (С. Старостин 2007a; G. Starostin 2010).
2) Для установления древности корней была использована индоевропейская база данных Dyen et al. 1997, которая, к сожалению, не является образцом аккуратности и достоверности.
3) Взятые корпуса отражают главным образом литературный язык, и уж точно не повседневную речь традиционного общества. Например, как часто в современном английском или русском употребляется слово ‘louse’? Ну а просто слово ‘meat’? Видимо, значительно реже, чем в речи традиционного общества.

Таким образом, необходимо констатировать, что гипотеза о высокой частотности сводешевских слов остается гипотезой. Попутно отметим, что утверждения:

“Our interest here is to examine the generality of one force known from previous work [6] to influence rates of lexical evolution, that being the frequency with which words are used in everyday speech” (Calude & Pagel 2011: 1101)
“Here we use a statistical model, which takes into account the frequency with which words are used in common everyday speech <...>” (Pagel et al. 2013: 1).
“<...> we expect that words with larger cognate class sizes will be predictable from their rates of lexical replacement <...> and from their frequency-of-use in everyday speech” (Pagel et al. 2013: 2-3; выделения мои)

являются некорректными, т.к. в работах Pagel et al. 2007; Calude & Pagel 2011 исследуется отнюдь не «common everyday speech», к сожалению.



3. Мелочи


1. Pagel et al. (2013: 1) сетуют, что дальнее родство не подтверждается статистическими тестами:

“Where statistical tests have been used (9, 13), the results have been inconclusive <...>”

Коль скоро авторы заговорили о статистических тестах, им следовало бы сослаться на B. Kessler. Word similarity metrics and multilateral comparison. In: Proceedings of Ninth Meeting of the ACL Special Interest Group in Computational Morphology and Phonology. Prague, 2007. P. 6–14, где показано, что индоевропейско-уральская гипотеза, в общем-то, проходит статистический тест (причем перестановочный тест между непосредственно праиндоевропейским и прауральским даст явно еще лучший результат, чем у Кесслера).

2. Статья Pagel et al. 2013 начинается с (неявного) утверждения, что если формы-потомки имеют одно и то же лексическое значение, то это же значение праформа имела в праязыке. Иллюстрируется утверждение английск. brother, латинск. frāter и родственными словами из других и.-е. — все они означают ‘брат’. Действительно, если праслово хорошо представлено в дочерних языках и всюду имеет одно и то же значение, то обычно мы реконструируем это же значение для праязыка и рассматриваем эту семантическую реконструкцию как высоконадежную. Однако изредка встречаются отклонения от этой типовой модели, а именно когда старое значение меняется на новое в силу новых технологических или социально-экономических условий, далее этот семантический сдвиг приобретает характер ареальной изоглоссы, охватывая большое количество соседних языков (не обязательно родственных). Классическим примером является слова для оружия дальнего действия в индейских языках (скажем, в юто-ацтекских; пример А.Давлетшина), где в современных языках слова-потомки обозначают ‘ружье’, в недавнем прошлом они обозначали ‘лук’ (переход ‘лук’ > ‘ружье’ при смене технологии), но т.к. лук также является не очень древней инновацией в этом регионе, для более раннего периода, как и для праюто-ацтекского, у этого слова следует предполагать значение ‘копьеметалка’ или вроде того.

К сожалению, как раз пример с ‘братом’, вероятно, относится к этой же редкой категории: и.-е. термин *bhrāter означал скорее не собственно ‘consanguineal brother’, а ‘male person related by kinship or by common social affiliation’ (см. Benveniste 1973; Kullanda 2002: 91 f.).



4. Выводы


Pagel et al. (2013) основывают на не слишком достоверном лингвистическом материале (ностратическая база LWED), но что еще хуже: авторы демонстрируют не отработанную методологию и ущербный инструментарий обработки лингвистических данных.

Поскольку, видимо, бóльшая часть индивидуальных лексикостатистических сближений, используемых в рецензируемой статье, неверна, то следует заключить, что и итоговое дерево ностратической семьи (Pagel et al. 2013: 5) не является достоверным (хотя в целом оно напоминает то предварительное дерево, которое наша группа получила при аккуратном анализе 50-словников, см. Kassian 2009/2010: 424).

09.05.2013 (to be published in English soon)


(Добавить комментарий)


[info]alkatar@lj
2013-05-09 14:41 (ссылка)
Алтайский. Видимо, только для праалтайского есть резон постулировать *p`oĺńe как праалтайский термин для ‘ASHES’ (см. базу). В первую очередь здесь играет роль топологический критерий: это бесспорный прамонгольский (*hüne-sü) и пратунгусо-маньчжурский (*pulńe-) термин для ‘ASHES’, а в пратюркском он сохранился как цветообозначение (*oń ‘grey, dun, ash-coloured’).

Все остальные алтайские основы, выписанные выше, — намного более слабые кандидаты на статус праалтайского термина ‘ASHES’. А, например, для *č`ṓga и *k`i̯āla вообще, строго говоря, нигде не фиксируется синхронное значение ‘ASHES’.


В тюркских нет никаких дериватов *p`oĺńe ни в значении 'ashes', ни в цветообозначении, ни в каких-либо иных близких значениях. Тот же "серый" в тюркских имеет основу "боз", а не приведенную здесь.

В алтайской базе обнаруживается ровно 1 корень с анатомической глоссой ‘eye’:
1) *ni̯ā̀ ‘eye’

Это очень стабильный праалтайский корень, сохраняющийся в базовом значении ‘eye’ во всех пяти группах.


Опять же в тюркских нет таких дериватов! Общетюркское 'eye' будет звучать как "кёз" с разными фонетическими вариантами.

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2013-05-09 14:51 (ссылка)
> В тюркских нет никаких дериватов *p`oĺńe

У меня приведена ссылка на базу: http://starling.rinet.ru/cgi-bin/response.cgi?single=1&basename=/data/alt/turcet&text_number=1368&root=config


> Опять же в тюркских нет таких дериватов! Общетюркское 'eye'...

А вот это верное замечание, спасибо. Действительно в тюркском старый 'глаз' перешел в 'слезу'. Исправил.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]alkatar@lj
2013-05-09 17:26 (ссылка)
1. Старостин в свою базу включал лексемы, даже не удосужившись проанализировать возможность их заимствования.
Наличие в Karakhanid: oj (MK), Middle Turkic: Kypch. oj (Houts.), Khakassian: oj, Tuva: oj, то есть, крайне ограниченное употребление этой формы, причем, в языках явно тесно и глубоко контактировавших с монгольским, явно свидетельствует о заимствованном характере этого слова в приведенных языках из монгольского языка. Общетюркское "серый" - "боз".

2. Что касается второго слова, то анлаутной 'n-' в монгольских, тунгусо-маньчжурских, корейском и 'm' в японском не может соответствовать тюркская аффриката "дж/ч", которая наиболее вероятна при реконструкции пратюркского. Но даже если вслед за Старостиным предположить анлаутную "й", то и в этом случае не может тюркская "й" соответствовать монгольскому и тунгусо-маньчжурскому "н".
Идем дальше, возьмем ауслаут. Реконструируется "булгарское" "-л" вместо общетюркского "-ш". Даже если не оспаривать данный момент, где соответствие тюркскому "л" в других приведенных алтайских формах? То же самое и в инлауте. В итоге, каким местом, например, тюркская *jāĺ соответствует монгольской *nidü? Тут исключительно острое желание С.Старостина найти такое соответствие и всё. Тем более, что даже семантика различна.

Proto-Altaic: *ni̯ā̀
Nostratic: Nostratic
Meaning: eye
Russian meaning: глаз
Turkic: *jāĺ 'tear' (слеза)
Mongolian: *nidü
Tungus-Manchu: *ńia-sa
Korean: *nún
Japanese: *mài(N), *mì-

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2013-05-09 17:54 (ссылка)
Тюркскую базу в первую очередь делала А.В.Дыбо.

1. Тюркское *oń не значит 'серый' как таковой, смотрите внимательнее, как выписано значение. Оно действительно скудно представлено и теоретически может быть монголизмом. Правда никто из авторов (EDAL, Räsanen, Clauson) не предполагает монгольского заимствования. Из какой монгольской формы оно, по вашему мнению, происходит?

Изъятие тюркской формы из сравнения никак не влияет на мою аргументацию.

2. Тюркский *j- (йот, а не аффриката) регулярно соответствует назальному в остальным группах, читайте введение в EDAL Нерегулярен m- в японском, про это см. комментарий к конкретной этимологии в EDAL. Про тюрк. *-ĺ также есть комментарий.

И опять, изъятие тюркской формы из сравнения никак не влияет на мою аргументацию.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lemon_sole@lj
2013-05-10 03:05 (ссылка)
...скорее усиливает аргументацию, ага - но с Pagel et al. всё и так ясно ("эта схема проста" - пропихнуть статью с вполне тривиальной "идеей", но не содержащую совсем уж явных ляпов, в "солидный" журнал типа Nature, а потом засорять откровенным бредом специализированные издания)... Настораживает анонимный комментарий ниже - если он действительно от А.В., посоветуйте ей, что ли, больше не ездить на летние школы в П., иначе к "Proto-IE: *abel-" она рано или поздно добавит "Russ. meaning конь"...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2013-05-10 09:40 (ссылка)
Таки в и.-е. базе что-то такое типа коня было (забыл подробности).

(Ответить) (Уровень выше)


[info]valeryz2001@lj
2013-05-09 19:27 (ссылка)
Большое спасибо Алексей за пост и все-все детали.

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2013-05-09 19:36 (ссылка)
Не за что, надеюсь, пригодится.

(Ответить) (Уровень выше)


(Анонимно)
2013-05-09 19:36 (ссылка)
В Махмуде, если что, количество монголизмов, видимо, очень мало и многими исследователями наличие там монголизмов вообще отрицается, так что распространение *oj говорит скорее против гипотезы о монголизме (у Клосона, например, идей о заимствовании тут не возникло). Но главное - чтобы предполагать монголизм, надо иметь соответствующее монгольское слово. Для *oj 'светло-серый' (о масти лошади) такого слова нет.

Вы не представляете себе, сколько разных "серых", кроме boz, используется для конских мастей в разных тюркских языках!

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2013-05-09 19:44 (ссылка)
Аня, спасибо за комментарий.

(Ответить) (Уровень выше)


[info]valeryz2001@lj
2013-05-09 19:41 (ссылка)
Каменты в ебаном динекесовом блоге малость взбесили. Geneticists really buy this because criticism of deep comparative studies has much in common with antidarwinism. Just a rampant and ignorant form of that :)

(Ответить)


[info]nornore@lj
2013-05-10 04:32 (ссылка)
Вот кста линк на англоязычную критику - http://languagelog.ldc.upenn.edu/nll/?p=4612

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2013-05-10 05:09 (ссылка)
Да, спасибо. Это наезд на ностратическую базу, а не на Пейгеля! Неприятно.

Еще критика: http://geocurrents.info/cultural-geography/linguistic-geography/do-ultraconserved-words-reveal-linguistic-macro-families

(Ответить) (Уровень выше)

post
[info]livejournal@lj
2013-05-10 15:54 (ссылка)
Пользователь [info]mshwan1@lj сослался на вашу запись в записи «post» в контексте: [...] Оригинал взят у в post [...]

(Ответить)


(Анонимно)
2013-05-10 17:42 (ссылка)
Согласен с общей критикой статьи Пейгеля. Относительно ИЕ *bhreHter, корень связан с другим ИЕ корнем, а именно *mer- (Lat maritus 'husband', Germ. *brudi 'bride', etc.) Связь между ними хорошо просматривается в таких морфологически сложных словах, как латв. marsa (< *martya) 'brother's wife' и лат. fratria 'brother's wife'. bh- в этом слове вторичного происхождения (mr > br > bhr) и связано, скорее всего, с влиянием второго ларингального в аффиксе. Исходная форма должна рекоструироваться как *mreH2ter. Короче, этот пример лексической стабильности, приводимый Пейгелем, является мнимым. См. Dziebel, G. V. “Reconstructing ‘our’ kinship terminology: Comments on the Indo-European material in A. V. Dybo’s and S. V. Kullanda’s The Nostratic terminology of kinship and affinity.” Алгебра родства 10 (2006).

Это подтверждает мысль, что "старое значение меняется на новое в силу новых технологических или социально-экономических условий." Однако, значение *mreH2ter было не ‘male person related by kinship or by common social affiliation’, а скорее всего свойственное или возрастное (ср. греч. meirax 'мальчик, девочка').

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2013-05-10 17:58 (ссылка)
Нет такого фонетического правила, чтобы mr повсеместно переходило в bhr.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-10 18:46 (ссылка)
Переход mr > br типичен для греческого, латинского и германского, а mr > bhr возникло в связи с наличием ларингального в этом слове (ср. dhugH2ter > Skrt duhita с той лишь разницей, что в *mreH2ter > *bhraater aspiration throwback дистантный. Ближайшая параллель *mreH2ter > *bhraater обнаруживается в лат. frigo при слав. *merznoti 'freeze' (< *mergh- or *mergH2- > *mregH2 > *bregH2- > *bhregH2- > *bhreg-). Интересно, что в алтайском имеется параллель ИЕ *mer-.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2013-05-10 19:25 (ссылка)
Форма с *bhr- в слове для 'брата' присутствует не только в греч., лат. и герм. См. согнаты (http://starling.rinet.ru/cgi-bin/response.cgi?single=1&basename=/data/ie/piet&text_number=+155&root=config).

Слово для 'дочери' действительно не однозначно фонетически (см. длинный разбор Parvulescu // Indogermanische Forschungen, 98 (1993):55–91). Однако я вообще не придерживаюсь ларингальной теории.

Пока, мне не кажется, что реконструкция *mr- предпочтительнее.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-10 21:54 (ссылка)
"Форма с *bhr- в слове для 'брата' присутствует не только в греч., лат. и герм."

Ну это легко объяснить наличием правила *mr- > *br в ПИЕ. Eстественно, не все br- предполагают раннее *mr-.

"Однако я вообще не придерживаюсь ларингальной теории."

Да, реконструкция *mreH2ter предполагает ларингальную теорию (и подкрепляет ее дополнительными примерами). Но можно ли поинтересоваться, чем вызван Ваш скептицизм по по поводу ЛТ?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2013-05-11 08:16 (ссылка)
> *mr- > *br в ПИЕ

Теоретически так можно считать, но мне не кажется методологически правильным постулировать фонетический закон на одном(!) примере. Тем более что этот пример ('брат') допускает более простое объяснение (исходное *bhr...).

Я не придерживаюсь ларингальной теории, потому что, во-первых, ни в одном из и.-е. языков этих ларингалов не сохранилось. Во-вторых, эта гипотеза является ненаучной: нет никакого способа ее фальсификации.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-11 11:08 (ссылка)
"на одном(!) примере"

По крайней мере 2 (*mreH2ter and *mregH2- 'freeze'), и я еще не закончил аудит всех bhr- гнезд. Не считая всех установленых mr > br переходов в греч., лат. и герм.

"допускает более простое объяснение"

Простота - понятие относительное. *mreH2ter объясняет происхождение сразу 2 гнезд (лат. frater и maritus), т.е. мы упрощаем ПИЕ реконструкции в два раза. *mregH2- 'freeze' объясняет изолированное лат. frigo-, связывая его с балтославянской изоглоссой. Немаловажно, что у ИЕ терминов для 'брат' появляется этимология, которую реконструкция *bhraater не дает. Такой подход, конечно, усложняет исследования таких ученых, как Пейгель, которым везде хочется видеть мнимую устойчивость слов, но я думаю это неплохо.

"ни в одном из и.-е. языков этих ларингалов не сохранилось".

Хеттский? Плюс в традиционной системе палатовелярные и звонкие лабиовелярные не прослеживаются ни в одном ИЕ языке. Праязык, по определению, является языком, который не сохранился.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2013-05-11 11:24 (ссылка)
Я понимаю вашу идею, и я с ней не согласен.

P.S. В анатолийских нет никаких "ларингалов". Это обычные велярные спиранты [x, ɣ].

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-11 11:52 (ссылка)
"Это обычные велярные спиранты [x, ɣ]."

Да, все понял. Вы правы. Но факт остается, что в прочих языках они выпадают, удлинняя соседние гласные, и, возможно, отражаются как согласные в некоторых условиях.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2013-05-11 13:52 (ссылка)
> Но факт остается, что в прочих языках они выпадают, удлинняя соседние гласные

Факт, что выпадают. А что касается долготы гласного в узкоиндоевропейских, то соответствия анатолийским "ларингалам" достаточно хаотические.

Современные ларингалистские теории не строятся на анатолийском материале. Это продукт внутренней реконструкции узкоиндоевропейской морфонологии (что, кстати, эксплицитно признают авторы типа M.Mayrhofer).

И эта внутренняя реконструкция избыточна и неоправдана, с точки зрения методологии.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-11 15:21 (ссылка)
"Современные ларингалистские теории не строятся на анатолийском материале. Это продукт внутренней реконструкции узкоиндоевропейской морфонологии (что, кстати, эксплицитно признают авторы типа M.Mayrhofer)."

И да, и нет. Узкоиндоевропейская морфофонология предвосхитила хеттские данные, но, Вы правы, что последние не являются источником ЛТ в строгом смысле слова.

"Факт, что выпадают. А что касается долготы гласного в узкоиндоевропейских, то соответствия анатолийским "ларингалам" достаточно хаотические."

Согласен. IMO (и здесь я предполагаю, что Вы будете протестовать), сравнение с хеттскими материалами указывает на двоякое отражение "ларингальных" как гласных (*peHs > хет. pahs 'защищать', лат. paasco- 'кормить, graze'), и как согласных (*peH-s > ИЕ *pek'-, напр. лат. pekus, скрт. pasu 'cattle'), хет. ishahru 'tear', ИЕ *dak'ru- 'tear' (лит. asru-) и др.). Причем интересно, что в последних двух случаях в узкоиндоевропейском фиксируется палатовелярный на материале сатемных языков, так что падение "ларингальных" видоизменяет как гласные (еН > aH > аа), так и согласные, превращая смычные с спиранты (еН > еk' > es). Кроме того, с фонетической точки зрения, "ларингальный" в хет. pahs повторяет спирант в германских (напр., англосакс. fehu 'скот'), подтвержая Вашу мысль, что "ларингальные" являются обычными спирантами. Почему отражение этих древних согласных двояко, я пока не знаю...

"И эта внутренняя реконструкция избыточна и неоправдана.."

В свете приведенных примеров, я бы сказал, что внутренняя реконструкция оправдана, но неполна. (Многие когнаты в ИЕ искусственно разведены по разным гнездам, что и создает хаос.) И хеттская фонетика является такой же производной, как, скажем, германская.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2013-05-11 15:55 (ссылка)
Вы считаете, что глагол 'защищать/пасти' и существительное *pek'- 'cattle' -- содержат один и тот же корень? Или я вас неправильно понял?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-12 20:32 (ссылка)
Правильно поняли. Один корень.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-12 21:16 (ссылка)
Это надо длинную пѣсню сочинять про фонетику - и, пожалуй, про до-индоевропейскую, всё-таки.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-12 23:56 (ссылка)
Да, в этом-то и интерес.

(Ответить) (Уровень выше)


[info]uxus@lj
2013-05-12 17:10 (ссылка)
*mregH2- 'freeze' объясняет изолированное лат. frigo-, связывая его с балтославянской изоглоссой.

А что происходитъ съ гласнымъ въ лат. frīg-?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-12 20:31 (ссылка)
Дифтонг не подходит из за слав. мръзнѫти. Остается влияние ларингального, присутствующего в праформе *merg'H2-. Ср. удлиннение гласного в лат. frāter и marītus из *mreH2ter.

Греч. ῥῖγος 'мороз', по любому, загадочна. Может *sbrigH2- с s-mobile?

Еще один пример, кстати, лат. fоrmīса при греч. μύρμηξ, βύρμᾱξ (у Гезихия), праслав. *morvi- 'муравей' и пр.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-12 20:50 (ссылка)
Ну, для "мороза" Вальде-Покорный (и кто-то до того) реконструировали *srīg (http://starling.rinet.ru/cgi-bin/response.cgi?root=config&morpho=0&basename=\data\ie\piet&first=1&off=&text_proto=sr%C4%ABg&method_proto=substring&ic_proto=on&text_meaning=frost&method_meaning=substring&ic_meaning=on&text_hitt=&method_hitt=substring&ic_hitt=on&text_tokh=&method_tokh=substring&ic_tokh=on&text_ind=&method_ind=substring&ic_ind=on&text_avest=&method_avest=substring&ic_avest=on&text_iran=&method_iran=substring&ic_iran=on&text_arm=&method_arm=substring&ic_arm=on&text_greek=&method_greek=substring&ic_greek=on&text_slav=&method_slav=substring&ic_slav=on&text_balt=&method_balt=substring&ic_balt=on&text_germ=&method_germ=substring&ic_germ=on&text_lat=&method_lat=substring&ic_lat=on&text_ital=&method_ital=substring&ic_ital=on&text_celt=&method_celt=substring&ic_celt=on&text_alb=&method_alb=substring&ic_alb=on&text_rusmean=&method_rusmean=substring&ic_rusmean=on&text_refer=&method_refer=substring&ic_refer=on&text_comment=&method_comment=substring&ic_comment=on&text_any=&method_any=substring&sort=proto&ic_any=on)-, и это, пожалуй, правильно.

Сближенiе со слав. всё-таки болѣе проблематично, даже если принять fr- из *mr-.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-12 23:48 (ссылка)
"Ну, для "мороза" Вальде-Покорный (и кто-то до того) реконструировали *srīg-, и это, пожалуй, правильно. "

Но других примеров греч. *s(r) ~ лат. f(r) нет, поэтому как то не хочется на этом успокаиваться. Форма *srīg- ничем особым не мотовирована. Почему не *wrig-, например, как 'rodos от *Frodos?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-16 09:35 (ссылка)
Другого примѣра на *sr- въ латыни я не знаю, но интервокально *-sr- достаточно регулярно даётъ -br-, т. е. *s даётъ тотъ же рефлексъ, что *dh. Спроецировать это развитiе на анлаутъ - вещь совершенно естественная.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-21 23:22 (ссылка)
Да, мне известны примеры в середине слова, но сравнение с dh меня не совсем убеждает, т.к. следовало бы ожидать, что кластер sr в латинском себя бы вел как кластер sl, т.е. s выпадало бы. К тому же неясно, почему s перешло в th перед r. Единственное, что могло изменить судьбу sr, так это латинский ротацизм. При контакте с r в середине слова s подвергся ротацизму (как в интервокальной позиции), т.е. sr > rr, a затем группа rr диссимилировалась в mr, откуда br, или напрямую rr > br? По моему гораздо проще представить себе memsro- > memrro > memmro > membrum, чем memsro > memthro > memfro > membrum. Но ни то, ни другое не объясняет fr- в friigus.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-23 10:18 (ссылка)
<...> следовало бы ожидать, что кластер sr в латинском себя бы вел как кластер sl, т.е. s выпадало бы. К тому же неясно, почему s перешло в th перед r.

Нѣтъ, не слѣдовало бы. (Тутъ можно нагромоздить примѣровъ и разсужденiй, но Вы и сами всё это знаете, полагаю.)

При контакте с r в середине слова s подвергся ротацизму (как в интервокальной позиции), т.е. sr > rr, a затем группа rr диссимилировалась в mr, откуда br, или напрямую rr > br?

Собственно ротацизмъ (т. е. совпаденiе озвончённыхъ рефлексовъ *s со старымъ *r) - весьма позднiй процессъ (въ отличiе отъ озвонченiя *s -> *z, которое очень непросто датировать), а такая диссимиляцiя -rr- выглядитъ, мягко говоря, фантастично.

По моему гораздо проще представить себе memsro- > memrro > memmro > membrum, чем memsro > memthro > memfro > membrum.

Membrum, дѣйствительно, не лучшiй примѣръ (съ т. зр. пониманiя механики звуковыхъ переходовъ). Гораздо показательнѣе напр. sobrīnus.

Но ни то, ни другое не объясняет fr- в friigus.

(1) У насъ есть переходъ *dh -> f въ анлаутѣ и *dh -> b въ инлаутѣ. Въ обоихъ случаяхъ логично предположить промежуточную стадiю съ интердентальнымъ (глухимъ или звонкимъ).

(2) Переходъ *sr -> *θr (или *zr -> *ðr) тривiаленъ и имѣетъ понятную мотивацiю.

(3) Въ латыни много другихъ случаевъ аналогичнаго расщепленiя рефлексовъ (глухой фрикативный въ анлаутѣ, звонкiй смычный по умолчанiю въ инлаутѣ).

(4) Сближенiе со славянскимъ болѣе (или не менѣе) проблематично (фонетически).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-24 01:06 (ссылка)
Хорошо, все вижу. Слабость здесь состоит в сочетании следующих факторов: a) sr- - уникальный фонетический кластер в лат. и греч.; б) rhigo- и friigus - уникальная греко-латинская изоглосса; c) sr > br/fr - уникальное кластерное поведение фонемы s как в латинском, так и в других ИЕ языках.

(Ответить) (Уровень выше)


[info]uxus@lj
2013-05-12 21:06 (ссылка)
Въ 'муравьѣ (http://starling.rinet.ru/cgi-bin/response.cgi?single=1&basename=/data/ie/piet&text_number=+715&root=config)' нѣтъ начальнаго кластера, зато по языкамъ много безумныхъ метатезъ и дистантныхъ ассимиляцiй/диссимиляцiй (въ половинѣ формъ начальное *w- - Вальде-Покорный считаетъ, что и въ формѣ изъ Гесихiя, что правдоподобно); тамъ возможны контаминацiи какъ минимумъ съ 'червёмъ (http://starling.rinet.ru/cgi-bin/response.cgi?single=1&basename=/data/ie/piet&text_number=1181&root=config)' и 'молью (http://starling.rinet.ru/cgi-bin/response.cgi?single=1&basename=/data/ie/piet&text_number=+766&root=config)'.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-12 23:53 (ссылка)
Ну, с 'молью' контаминация маловероятна. И в любом случае, никакие из нерегулярных процессов не объяснят анлаут в лат. formica.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-16 10:03 (ссылка)
Съ "молью" могли контаминировать нѣкоторыя индо-иранскiя формы.

Насчётъ "никакихъ процессовъ" я бы не зарекался - можно подумать, мы хорошо понимаемъ историческую фонетику латыни...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-21 23:24 (ссылка)
Но все же f в formica не присутствует ни в каких словах, выдвигаемых на роль контаминаторов.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-23 10:42 (ссылка)
Похоже, исходная и.-е. форма тамъ всё-таки *mVrw(i)-, т. е. въ любомъ случаѣ очень похоже на метатезу въ латыни.

Переходъ *[m...w] -> *[m...β] вполнѣ можно считать (неполной) ассимиляцiей; [β] (фонема или аллофонъ) всё равно необходимъ какъ промежуточная стадiя въ рядѣ лат. фонетическихъ процессовъ.

Реконструировать особую фонему въ этой основѣ, конечно соблазнительно, но не на единственномъ же примѣрѣ это дѣлать (а съ 'братомъ' тутъ маловато общаго).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-24 00:38 (ссылка)
Да, можно на эту форму и так посмотреть. Но при этом f- остается без объяснения. Согласен, что структура корня не вполне совпадает с 'братом'. В идеале только *bhr- формы подходят. Утешает только типичность корневого чередования типа *mVr-/*mrV-, xoтя в этом гнезде доминирует *mVr-. С этим единственным допущением, цепочки 'муравей' и 'брат' параллельны как с кластерной, так и с придыхательной точки зрения.

*mrowiHx- > *mromiHx- (ср. греч. murmees) > *bromiHx- > *bhromi- > *fromii- > *formii-ca.
*mreH2ter > *breH2ter > *bhreH2ter > *bhraater > *frater.

(Ответить) (Уровень выше)


[info]uxus@lj
2013-05-12 17:17 (ссылка)
Не считая всех установленых mr > br переходов в греч., лат. и герм.

Въ германскомъ? Можно примѣры?

(Но зато, кажется, можно добавить санскритъ - brávīti 'говоритъ', br- <- *ml-.)

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-12 20:04 (ссылка)
Помимо герм. bruudi 'невеста' (см. выше), могу привести др.англ. bræġen от герм. *bragnam from *mroǵhnos.

Спасибо за brávīti 'говоритъ', br- <- *ml-. Не знал!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-12 20:34 (ссылка)
Ой, комментъ заспамился...

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-12 20:36 (ссылка)
< Онъ же, безъ ссылки: >

Не за что :) Это вполнѣ традицiонно, "вездѣ" упоминается.

Этотъ германскiй "мозгъ (http://starling.rinet.ru/cgi-bin/response.cgi?single=1&basename=/data/ie/piet&text_number=+801&root=config)" - съ проблемами, всё-таки. Къ нему кромѣ греческаго есть какiя-нибудь параллели?

Въ любомъ случаѣ, въ герм. примѣрахъ - германское *b-, т. е. это завѣдомо не праиндоевропейскiй процессъ.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-12 23:00 (ссылка)
"Это вполнѣ традицiонно, "вездѣ" упоминается."

Да, действительно...зевнул.

"Этотъ германскiй "мозгъ" - съ проблемами, всё-таки. Къ нему кромѣ греческаго есть какiя-нибудь параллели?"

Нет, 'мозг' это греко-германская изоглосса.

"Въ любомъ случаѣ, въ герм. примѣрахъ - германское *b-, т. е. это завѣдомо не праиндоевропейскiй процессъ."

Да, но, если все случаи mr > br в разных ветвях конвергентны, процесс явно был настолько типичен, что, наверное, действовал, и в праиндоевропейском. Еще из германских примеров: прагерм. *bremmanan и греч. μορμύρω и в середине слова ПИЕ *dem-ro > др.исл. timbr, англ. timber.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-16 09:46 (ссылка)
Да, но, если все случаи mr > br в разных ветвях конвергентны, процесс явно был настолько типичен, что, наверное, действовал, и в праиндоевропейском.

Это неправильное разсужденiе, по-моему.

Процессъ не просто типиченъ, онъ тривiаленъ, и именно поэтому повторяется въ разныхъ вѣтвяхъ.

А соотвѣтствiя типа герм. :: греч. показываютъ, что группа *mr- въ анлаутѣ не была запрѣщена. Т. е. никакой процессъ, относящiйся къ той эпохѣ, это сочетанiе не устранялъ.

Поэтому единственный поводъ задумываться надъ кластеромъ въ 'братѣ' и т. д. - нѣкоторая вѣроятность доиндоевропейскаго фонетическаго процесса въ этихъ основахъ. Въ ностратической перспективѣ съ происхожденiемъ и.-е. начальныхъ кластеровъ много неясностей, и могутъ быть интересны въ т. ч. и нетрадицiонныя гипотезы такого типа.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-22 00:11 (ссылка)
Я бы все же отнес этот процесс к праиндоевропейскому, а не к доиндоевропейскому/ностратическому слою. Пример типа *bhreH2ter < *mreH2ter, судя по одной дистрибуции, явно относится к древнейшему этапу происхождения ИЕ языков, но вместе с тем буквальный морфологический и семантический параллелизм латв. marsa и лат. fratria 'жена брата' указывает на вполне обозримую эпоху. Пара *bhreH2ter/ *mreH2ter интересна не только с точки зрения кластеров, но с точки зрения потенциального источника звонких придыхательных. По аналогии с *bhreH2ter < *mreH2ter, можно, как кажется, реконструировать не ПИЕ *dhugH2ter 'дочь', а *dugH2ter: на следующем этапе придыхание распредилось по разным сегментам, так что гот. dauhtar и греч. thugater восходят к *dhugH2ter, а скрт. duhita - к *dughH2ter.

В ИЕ фонетике еще много неясного, и до ностратического уровня мы, как кажется, еще не доросли. Во всяком случае я не дорос... А пересмотр традиционных ИЕ этимологических гнезд убедил меня в том, что некоторые фундаментальные ПИЕ процессы еще предстоит описать, и реконструкции, которые пошли в основу ностратики, могут оказаться неприемлемыми с чисто ИЕ точки зрения. На их месте появятся другие.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-23 16:43 (ссылка)
Понятно.

Грубо говоря, тутъ возможны два подхода.

(1) Мы понимаемъ, что наша реконструкцiя ПИЕ не безъ проблемъ, и просматриваемъ альтернативныя сближенiя въ поискахъ намёковъ на потенцiальныя рѣшенiя.

(2) Намъ очень нравятся нѣкоторыя альтернативныя сближенiя, и ради нихъ мы отягощаемъ ПИЕ реконструкцiю дополнительными проблемами (напр. адхочными цѣпочками новыхъ постулируемыхъ нами процессовъ, каждый изъ которыхъ мы можемъ, поднапрягшись, проиллюстрировать гдѣ-то двумя примѣрами).

Къ сожаленiю, я тутъ вижу скорѣе второе, чѣмъ первое. По-моему, это плохо.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-23 23:28 (ссылка)
Мне представляется Ваш подход к подходам несколько манихейским. Есть сравнительный метод, который надо продолжать применять. Про методологические дополнения к традиционному сравнительному методу я много писал в "Алгебре родства." Сравнительный метод рано или поздно приведет к росту количества новых примеров и переосмыслению "традиционных" результатов. Чем дальше в глубь веков, тем фонетические законы, на которых базируется "языковое родство," становятся сложнее и сложнее, потому что один напластовывается на другой. Семантика тоже дрейфует. Поэтому сравнительный метод должен становиться более и более системным. И никакой моральной подоплеки (плохо - xoрошо) здесь нет. В индоевропеистике очень много исключений из правил, изолированных форм, узколокальных изоглосс, форм с причудливыми этимологиями. Это, наверное, нормально. Но и желание разрешить эти вопросы тоже нормально. Наверное, нормально.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-24 12:17 (ссылка)
Про методологические дополнения к традиционному сравнительному методу я много писал <...>

Знаете, честно говоря, какъ бы это помягче... на фонѣ остальныхъ Вашихъ комментовъ (начиная съ перваго) это звучитъ какъ изрядная антиреклама "алгебры".

Мне представляется Ваш подход к подходам несколько манихейским.

Вы эзотерикъ?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-24 14:55 (ссылка)
"Знаете, честно говоря, какъ бы это помягче... на фонѣ остальныхъ Вашихъ комментовъ (начиная съ перваго) это звучитъ какъ изрядная антиреклама "алгебры"."

Вы перешли на глупости. Ну, как угодно.

"Вы эзотерикъ?"

Нет.

(Ответить) (Уровень выше)


[info]ext_1795828@lj
2013-05-24 15:07 (ссылка)
Кстати, не сочтите за странное любопытство, но можно узнать Ваши ФИО? Мне понравилась наша дискуссия, и я ее отражу у себя на сайте www.kinshipstudies.org. Вы ученый? Лингвист? Любитель?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]uxus@lj
2013-05-24 16:14 (ссылка)
Это, конечно, секретъ полишинеля, но я бы не хотѣлъ громко деанонимизировать свой бложикъ. Отражать, разумѣется, можно какъ угодно и гдѣ угодно.

У меня нѣтъ (и не будетъ) учёной степени, а также диплома по спецiальности, имѣющей какое-нибудь отношенiе къ компаративистикѣ.

Кстати, именно это, какъ я считаю, иногда даётъ мнѣ право говорить вещи, которыя профессiоналамъ произносить бываетъ неловко. Извините.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]ext_1795828@lj
2013-05-24 19:30 (ссылка)
В общении со мной даже ведущие специалисты ведут себя, как Вы, по-диллетански. (Надеюсь, Вы оцените мой шутливый тон, который порой теряется в онлайновой переписке.) Так что извиняться не за что. Я на Вас не сержусь, просто меня в нашем разговоре интересуют только Ваши сугубо этимологические/компаративистские замечания.

(Ответить) (Уровень выше)


(Анонимно)
2013-05-19 15:37 (ссылка)
I read this article, which I consider interesting and important, with the help of Google Translate, as I have no Russian to speak of. Can you explain the word "внешнеэтимологического", please? The context suggests "unetymological": is that correct? Thank you.

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2013-05-19 15:42 (ссылка)
Hope I'll translate it into English this summer.

"внешнеэтимологический" = "внешний этимологический", it means 'external etymological', as opposed to "внутренний этимологический" ('internal etymological').

(Ответить) (Уровень выше)


[info]mockba00@lj
2013-05-19 18:05 (ссылка)
Sorry John I opined too fast at Language Hat () and some tech problem there prevents me from postingthere now. So I'll reply here :)

In Kassian's excellent analysis (http://kassian.livejournal.com/301900.html), the word isn't used for general critique; rather, "external etymology" is a specific methodological term describing one of several criteria used for semantic annotation of proto-languages (i.e. which particular meanings are associated with a particular reconstruction). (He describes it English in a paper on proto-Lezgian (http://www.academia.edu/3040336/The_Lezgian_linguistic_group_within_the_framework_of_the_Global_Lexicostatistical_Database), pp. 5-6)

Kassian lists "topological constraints" (minimizing the number of nodes with changed meanings on the phylogenetic tree), "external and internal etymological constraints" (external etymology maximizes fit with neighboring nodes on the phylogenetic tree, while internal etymology penalizes derived / figurative meanings emerging within the language itself, and favors only primary meanings), and "semantic shift directionality constraints" (where some meanings are only supposed to shift in one direction, but not backwards; in his example, from "to shine" one may get "moon", but not the other way around).

There is no doubt that in genetics, the equivalent of external etymology is its overarching principle, and ambiguity of semantic reconstruction is barely addressed, if at all. That's because the most useful genetic "words" occur in the same contexts of longer, unambiguously identified "texts" (like variations in mitochondrial DNA). The equivalency of semantics is thus completely assured.

Then there are genetic motifs which are repeatedly utilized for different related functions in the genome, and sometimes abandoned in non-functional state (roughly paralleling primary, derived, and archaic meanings in a language), but those "words" are typically excluded from phylogenetic analyses. So the current toolkit of genetics is unprepared for semantic complexity of proto-language reconstruction.

Pagel et al. may be tempted to consider semantic ambiguities to be a random fluctuation, sort of averaged out in the statistical analysis. But Kassian suggests that selecting semantic reconstructions based solely on "external etymological constraints" introduces a non-random bias of ascertainment into the data (borrowed words, or derived meanings of later times, will be selected more often than by chance if they show external, and likely superficial, similarities).

(Ответить) (Уровень выше)


[info]mockba00@lj
2013-05-19 18:16 (ссылка)
Sorry John I opined too fast:) and Language Hat (http://www.languagehat.com/archives/005010.php) can't post my comment, so I can as well try here?

In Kassian's excellent analysis (http://kassian.livejournal.com/301900.html), the word isn't used for general critique; rather, "external etymology" is a specific methodological term describing one of several criteria used for semantic annotation of proto-languages (i.e. which particular meanings are associated with a particular reconstruction). (He describes it English in a paper on proto-Lezgian, pp. 5-6)

Kassian lists "topological constraints" (minimizing the number of nodes with changed meanings on the phylogenetic tree), "external and internal etymological constraints" (external etymology maximizes fit with neighboring nodes on the phylogenetic tree, while internal etymology penalizes derived / figurative meanings emerging within the language itself, and favors only primary meanings), and "semantic shift directionality constraints" (where some meanings are only supposed to shift in one direction, but not backwards; in his example, from "to shine" one may get "moon", but not the other way around).

There is no doubt that in genetics, the equivalent of external etymology is its overarching principle, and ambiguity of semantic reconstruction is barely addressed, if at all. That's because the most useful genetic "words" occur in the same contexts of longer, unambiguously identified "texts" (like variations in mitochondrial DNA). The equivalency of semantics is thus completely assured.

Then there are genetic motifs which are repeatedly utilized for different related functions in the genome, and sometimes abandoned in non-functional state (roughly paralleling primary, derived, and archaic meanings in a language), but those "words" are typically excluded from phylogenetic analyses. So the current toolkit of genetics is unprepared for semantic complexity of proto-language reconstruction.

Pagel et al. may be tempted to consider semantic ambiguities to be a random fluctuation, sort of averaged out in the statistical analysis. But Kassian suggests that selecting semantic reconstructions based solely on "external etymological constraints" introduces a non-random bias of ascertainment into the data (borrowed words, or derived meanings of later times, will be selected more often than by chance if they show external, and likely superficial, similarities).

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]kassian@lj
2013-05-19 18:29 (ссылка)
Thanks for the English summary of my criticism.

(Ответить) (Уровень выше)


[info]clancy_hsimriks@lj
2013-06-10 11:27 (ссылка)
Почему эскалеутские с чукотско-камчатскими пытаются в ностратические запихнуть? Есть ли какие-то серьёзные основания?
Как быть со спорным статусом чукотско-камчатских - есть версия о неродстве ительменского и чукотско-корякских?

(Ответить) (Ветвь дискуссии)


[info]kassian@lj
2013-06-10 12:21 (ссылка)
версий есть много. подкрепленных мало.

(Ответить) (Уровень выше)