|
|
|
July 10th, 2012
08:09 pm - Корпус несовершенных переводов доступен в сети «Ура-ура, сказали тут швамбраны все» В смысле, мы (научно-исследовательская группа «Корпус несовершенных переводов») наконец-то выставили онлайн наше детище - этот самый корпус. Это большое собрание переводов, которые выполняли (и выполняют) студенты в разных университетах нашей страны. Можно искать, как переводили то или иное слово или словосочетание. Можно искать, в каких контекстах в переводах употребляется то или иное слово или словосочетание. Переводы с русского на английский и с английского на русский. Ещё корпус размечен данными о ситуации перевода - ну там, пол переводчика, год обучения, оценка, университет, жанр текста и т.д. Можно всякие хитровывернутые сочетания условий искать.
Это, конечно, ещё не финальный вариант, там ещё много работы, но всё же уже вполне рабочая вещь. По-английски называется Russian Learner Translator Corpus, по аналогии с европейским корпусом MeLLANGE. Смотреть и щупать здесь: http://rus-ltc.org Спасибо enemo@lj за хостинг.
|
Comments:
ой. пойду нагрузку мониторить.
Я не думаю, что будет slashdot-эффект :)
А почему в поиске нет отсечения по часть слова/слово? В смысле, на запрос "я" зачем-то находится - "Дерек Уолкотт - не американец". - "Теперь - американец". Мы тяжело вздохнули. - "Мастерская Деда Мороза" откроется 6 декабря в Благотворительном фонде развития города Тюмени. Про бету я всё понимаю, но это уж надо было первейшим образом сделать.
Что там внутри? На чём поиск? Как выглядит "mistakes annotation" и будет ли она (и как) коррелировать с дополнительными параметрами поиска? Интерфейсно спорное решение выводить каждый раз описание проекта под выдачей, n'est pas? А если ничего не нашлось, то и вообще не видно этой надписи, такое впечатление, что поиск попыхтел и сломался. Разворачивать каждый раз кликом, чтобы узнать, как выглядят параллельные фрагменты - не удар ли это в спину user-friendliness? Символика какая грозная! Не иначе, экстремизм :)
Почти все указанные недоработки у нас есть в feature requests для программистов. Но сейчас лето, все по отпускам :) Внутри там java, ищущая по TMX-файлу. Разметка по ошибкам ещё разрабатывается.
Насчет описания проекта согласен, надо это перебазировать куда-то. Ну и про символику - это логотип, предложенный одной из студенток-участниц проекта. Ничего лучше не предложили. Может, за лето что-то нарисуется. |
|
|
|
|
LJ.Rossia.org |