Журнал Андрея Мальгина - Даешь ворд
February 17th, 2010
06:02 am

[Link]

Previous Entry Add to Memories Tell A Friend Next Entry
Даешь ворд

(199 комментариев | Оставить комментарий)

Comments
 
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:14 am
(Link)
некоторые слова употребляются вместе (сочетаются), а некоторые нет. И это абсолютно критично для человека, изучающего язык!

спасибо, я знаю, что 2*2 = 4

Есть у вас словарь, в котором можно об этом узнать?

для этого нужен не словарь, а корпус текстов с системой поиска. Конкорданс называется. Скоро будет в виде online-сервиса
From:[info]rupasov@lj
Date:February 17th, 2010 - 06:19 am
(Link)
Не нужен для этого корпус текстов. Вернее, он для этого тупо бесполезен. Что вам для этого действительно нужно, так это исчерпывающий список ВСЕХ слов, с которыми сочетается интересующее вас слово.

Если вы не поленитесь зайти-таки по этой ссылке, то поймете, наконец, о чем я толкую: http://193.133.140.102/JustTheWord/

Ничего более полезного и функционального я не видел. Если вы видели, то просьба поделиться.
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:21 am
(Link)
JustTheWord получает словосочетания автоматически по корпусу текстов
From:[info]rupasov@lj
Date:February 17th, 2010 - 06:25 am
(Link)
Ну, как он работает я не знаю, да мне и не интересно. Мне интересно, в каком виде он выдает результат.

Факт в том, что сырой корпус текстов для решения задачи сочетаемости слов использовать невозможно. Я должен искать не по корпусу, а по списку. Как будет составляться список - не мой вопрос.
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:27 am
(Link)
нормальный конкорданс как раз и предполагает возможность получения по корпусу текстов самой разной информации, в том числе и о сочетаемости слов. Ничего вручную искать по корпусу не надо.
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:45 am
(Link)
где-то в течении полугода. Найти сервис можно будет через сайт lingvo.ru, новые версии Лингво будут с ним интегрированы.
From:[info]rupasov@lj
Date:February 17th, 2010 - 06:52 am
(Link)
Кстати, concordance - это алфавитный список слов с указанием места в тексте и ближайшего контекста. То есть, задачу сочетаемости он никак не решает. Или вы трактуете значение этого слова расширительно? Или дважды-два все-таки не столько четыре, сколько где-то так семь-восемь, и вам придется-таки пойти по ссылке и посмотреть, что я имею в виду. ))
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 06:56 am
(Link)
так было в докомпьютерную эпоху. Сейчас понятие существенно расширилось:

"Программы конкорданса, которые позволяют находить примеры слов или выражений в употребляемом контексте в одноязычном, двуязычном или многоязычном корпусе, как например, битекст или память переводов"

http://ru.wikipedia.org/wiki/%D0%90%D0%B2%D1%82%D0%BE%D0%BC%D0%B0%D1%82%D0%B8%D0%B7%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D1%8B%D0%B9_%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4
From:[info]rupasov@lj
Date:February 17th, 2010 - 07:00 am
(Link)
Да, это именно то, чего я боялся. Не нужны мне "примеры". Мне нужен исчерпывающий список с частотными характеристиками. Например, я набираю слово "solve" и получаю следующую телегу:

solve the difficulties (7)
solve the difficulty (6)
solve dilemma (13)
solve enigma (6)
solve issue (15)
solve mystery (70)
solve a mystery (6)
solve the mystery (33)
solve problem (1673)
solve basic problem (6)
...
actually solve (7)
already solve (8)
easily solve (14)
largely solve (6)
neatly solve (5)
necessarily solve (5)
never solve (10)
partially solve (5)
...
[User Picture]
From:[info]softwarengineer@lj
Date:February 17th, 2010 - 07:00 am
(Link)
не переживайте, все будет
From:[info]rupasov@lj
Date:February 17th, 2010 - 07:03 am
(Link)
Я не переживаю. Все уже есть.
My Website Powered by LJ.Rossia.org