Блог Переводчика

На Яндекс.Переводчике появились марийский и горномарийский языки

6 сентября 2016, 16:02

Мы запустили машинный перевод для марийского и горномарийского языков. Теперь пользователи могут переводить слова и фразы с любого из этих языков на 86 других — и наоборот.

Марийский (или лугово-восточный марийский) и горномарийский языки — это, как и русский, государственные языки Республики Марий Эл. На них разговаривают также в Башкортостане, Татарстане, Кировской области и некоторых других регионах России. Хотя марийский и горномарийский языки похожи, одно и то же слово может звучать в этих языках совсем по-разному, есть отличия в правилах грамматики, не совпадают и алфавиты. Поэтому работа над машинными переводами для этих двух языков велась параллельно. Пока оба перевода работают в бета-версии, так что возможны недочёты.

Работа по созданию марийско-русского перевода велась с тесном сотрудничестве с региональными организациями – Марийским научно-исследовательским институтом языка, литературы и истории им. В.М. Васильева (МарНИИЯЛИ) и Республиканским центром марийской культуры (РЦМК), обеспечивших лингвистическую поддержку и подготовку эталонных марийско-русских переводов для оценки качества перевода. Помимо этого, руководство МарНИИЯЛИ (директор А.С.Казимов) предоставило права на использование большой словарной базы Марийско-Русского Словаря, а Андрей Чемышев вместе с группой сотрудников РЦМК собрал дополнительный корпус двуязычных русско-марийских текстов. Благодаря этим лексическим ресурсам, нам удалось значительно увеличить объем и качество данных, используемых для построения статистических моделей, и, тем самым, повысить итоговое качество машинного перевода. 

8 комментариев
Откуда вы их только берёте ))
lich.mendosa,
что берут?
majoroff.mikhail2018
3 марта 2017, 17:13
зачем так много разных стран
Мария Лешканова
6 ноября 2017, 08:31
majoroff.mikhail2018,
Это языки народов Росии
nik-14.muravjov.nikita
29 августа 2018, 09:43
Добавьте карельский, коми, саамские, хантыйский, мансийский, мокшанский, эрзянский, ненецкий, энецкий, нганасанский и селькупский в переводчик в 1 сентября
Возмездие
Ончыч тудо царёв город на какшаге маналтын, марий влак чарла манын лумденыт. Ожно олаштн лопка, лавыран урем влак, шукыжо ИК пачашан пу порт влак лийынт. Чарлам вич черке сорастарен. Рудола статусы 1920 ийыште налын.
Хуй соси