|
December 22nd, 2015
11:35 pm - Дистрибутивную семантику в массы
|
Comments:
В топе существительные же. Впрочем, если ограничить прилагательными, то сербохорватский и лужицкий все равно будут ближе русского в НКРЯ :)
"язык русский 0.46063" - это на новостном корпусе, там "русский" действительно ближайшее прилагательное после "иноязычный" и "языковой".
Цифра значит косинусную близость между векторами соответствующих слов. Там подробно написано в About :) |
|
|
LJ.Rossia.org |