Записки на обоях - Корпус несовершенных переводов доступен в сети

> Recent Entries
> Archive
> Friends
> User Info
> Мой Mastodon

July 10th, 2012


Previous Entry Add to Memories Tell A Friend Next Entry
08:09 pm - Корпус несовершенных переводов доступен в сети
«Ура-ура, сказали тут швамбраны все»
В смысле, мы (научно-исследовательская группа «Корпус несовершенных переводов») наконец-то выставили онлайн наше детище - этот самый корпус.
Это большое собрание переводов, которые выполняли (и выполняют) студенты в разных университетах нашей страны. Можно искать, как переводили то или иное слово или словосочетание. Можно искать, в каких контекстах в переводах употребляется то или иное слово или словосочетание. Переводы с русского на английский и с английского на русский.
Ещё корпус размечен данными о ситуации перевода - ну там, пол переводчика, год обучения, оценка, университет, жанр текста и т.д. Можно всякие хитровывернутые сочетания условий искать.

Это, конечно, ещё не финальный вариант, там ещё много работы, но всё же уже вполне рабочая вещь. По-английски называется Russian Learner Translator Corpus, по аналогии с европейским корпусом MeLLANGE.
Смотреть и щупать здесь: http://rus-ltc.org
Спасибо [info]enemo@lj за хостинг.

(5 comments | Leave a comment)

Comments:


[User Picture]
From:[info]steinkrauz
Date:July 10th, 2012 - 04:55 pm
(Link)
Надо в http://sadtranslations.livejournal.com/ прорекламировать.
From:[info]enemo.livejournal.com
Date:July 10th, 2012 - 05:06 pm
(Link)
ой. пойду нагрузку мониторить.
[User Picture]
From:[info]tyumen_kender
Date:July 10th, 2012 - 05:19 pm
(Link)
Я не думаю, что будет slashdot-эффект :)
From:[info]nevmenandr
Date:July 11th, 2012 - 08:31 am
(Link)
А почему в поиске нет отсечения по часть слова/слово? В смысле, на запрос "я" зачем-то находится
- "Дерек Уолкотт - не американец". - "Теперь - американец". Мы тяжело вздохнули.
- "Мастерская Деда Мороза" откроется 6 декабря в Благотворительном фонде развития города Тюмени.
Про бету я всё понимаю, но это уж надо было первейшим образом сделать.

Что там внутри? На чём поиск?
Как выглядит "mistakes annotation" и будет ли она (и как) коррелировать с дополнительными параметрами поиска?
Интерфейсно спорное решение выводить каждый раз описание проекта под выдачей, n'est pas? А если ничего не нашлось, то и вообще не видно этой надписи, такое впечатление, что поиск попыхтел и сломался.
Разворачивать каждый раз кликом, чтобы узнать, как выглядят параллельные фрагменты - не удар ли это в спину user-friendliness?
Символика какая грозная! Не иначе, экстремизм :)
[User Picture]
From:[info]tyumen_kender
Date:July 25th, 2012 - 09:51 pm
(Link)
Почти все указанные недоработки у нас есть в feature requests для программистов. Но сейчас лето, все по отпускам :)
Внутри там java, ищущая по TMX-файлу.
Разметка по ошибкам ещё разрабатывается.

Насчет описания проекта согласен, надо это перебазировать куда-то.
Ну и про символику - это логотип, предложенный одной из студенток-участниц проекта. Ничего лучше не предложили. Может, за лето что-то нарисуется.

> Go to Top
LJ.Rossia.org