Журнал Андрея Мальгина - Даешь ворд
February 17th, 2010
06:02 am

[Link]

Previous Entry Add to Memories Tell A Friend Next Entry
Даешь ворд

(199 комментариев | Оставить комментарий)

Comments
 
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 03:55 am
(Link)
совершенно верно. Поэтому в последних версиях Лингво есть Коллинз и Оксфорд
From:[info]rupasov@lj
Date:February 17th, 2010 - 05:10 am
(Link)
Серьезно? Это очень круто. Это уже почти полдела. Если вы еще вторую половину сделаете, то вообще цены не будет. Я имею в виду сочетаемость слов. Что-нибудь типа такого: http://193.133.140.102/JustTheWord/

А если еще и вот это добавите, то все - я ваш навек: http://www.natcorp.ox.ac.uk/
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 05:29 am
(Link)
да, все есть: http://www.abbyy.ru/lingvo/english_version

к сожалению, толковый словарь Ефремовой, - далеко не Оксфорд, хороших толковых словарей русского языка, увы, нет.

что касается сервисов типа BNC, то следите за обновлениями. Скоро будет нечно подобное.
From:[info]rupasov@lj
Date:February 17th, 2010 - 06:11 am
(Link)
Нет, нет, JustTheWord - это совсем другое. Вопрос не в толковании. Вопрос в СОЧЕТАЕМОСТИ слов. Ну, например, можно сказать "solve the problem", но нельзя сказать "solve the task". Причем, ни из каких толкований значений слова "to solve" этого знания не выведешь. Просто так не говорят, и все. Без причины.

То есть, есть такой лингвистический факт: некоторые слова употребляются вместе (сочетаются), а некоторые нет. И это абсолютно критично для человека, изучающего язык! Есть у вас словарь, в котором можно об этом узнать?
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:14 am
(Link)
некоторые слова употребляются вместе (сочетаются), а некоторые нет. И это абсолютно критично для человека, изучающего язык!

спасибо, я знаю, что 2*2 = 4

Есть у вас словарь, в котором можно об этом узнать?

для этого нужен не словарь, а корпус текстов с системой поиска. Конкорданс называется. Скоро будет в виде online-сервиса
From:[info]rupasov@lj
Date:February 17th, 2010 - 06:19 am
(Link)
Не нужен для этого корпус текстов. Вернее, он для этого тупо бесполезен. Что вам для этого действительно нужно, так это исчерпывающий список ВСЕХ слов, с которыми сочетается интересующее вас слово.

Если вы не поленитесь зайти-таки по этой ссылке, то поймете, наконец, о чем я толкую: http://193.133.140.102/JustTheWord/

Ничего более полезного и функционального я не видел. Если вы видели, то просьба поделиться.
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:21 am
(Link)
JustTheWord получает словосочетания автоматически по корпусу текстов
From:[info]rupasov@lj
Date:February 17th, 2010 - 06:25 am
(Link)
Ну, как он работает я не знаю, да мне и не интересно. Мне интересно, в каком виде он выдает результат.

Факт в том, что сырой корпус текстов для решения задачи сочетаемости слов использовать невозможно. Я должен искать не по корпусу, а по списку. Как будет составляться список - не мой вопрос.
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:27 am
(Link)
нормальный конкорданс как раз и предполагает возможность получения по корпусу текстов самой разной информации, в том числе и о сочетаемости слов. Ничего вручную искать по корпусу не надо.
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:45 am
(Link)
где-то в течении полугода. Найти сервис можно будет через сайт lingvo.ru, новые версии Лингво будут с ним интегрированы.
From:[info]rupasov@lj
Date:February 17th, 2010 - 06:52 am
(Link)
Кстати, concordance - это алфавитный список слов с указанием места в тексте и ближайшего контекста. То есть, задачу сочетаемости он никак не решает. Или вы трактуете значение этого слова расширительно? Или дважды-два все-таки не столько четыре, сколько где-то так семь-восемь, и вам придется-таки пойти по ссылке и посмотреть, что я имею в виду. ))
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:56 am
(Link)
так было в докомпьютерную эпоху. Сейчас понятие существенно расширилось:

"Программы конкорданса, которые позволяют находить примеры слов или выражений в употребляемом контексте в одноязычном, двуязычном или многоязычном корпусе, как например, битекст или память переводов"

http://ru.wikipedia.org/wiki/%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D0%B7%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D0%B9_%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4
From:[info]rupasov@lj
Date:February 17th, 2010 - 07:00 am
(Link)
Да, это именно то, чего я боялся. Не нужны мне "примеры". Мне нужен исчерпывающий список с частотными характеристиками. Например, я набираю слово "solve" и получаю следующую телегу:

solve the difficulties (7)
solve the difficulty (6)
solve dilemma (13)
solve enigma (6)
solve issue (15)
solve mystery (70)
solve a mystery (6)
solve the mystery (33)
solve problem (1673)
solve basic problem (6)
...
actually solve (7)
already solve (8)
easily solve (14)
largely solve (6)
neatly solve (5)
necessarily solve (5)
never solve (10)
partially solve (5)
...
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 07:00 am
(Link)
не переживайте, все будет
From:[info]rupasov@lj
Date:February 17th, 2010 - 07:03 am
(Link)
Я не переживаю. Все уже есть.
My Website Powered by LJ.Rossia.org