Блог Переводчика

Это официальный блог сервиса Яндекс.Переводчик. Здесь мы будем рассказывать о том, что нового произошло на нашем сервисе, какие изменения и улучшения мы внесли, а также о наших достижениях в области машинного перевода.

Мы всегда рады пожеланиям и замечаниям наших пользователей!

Команда сервиса Яндекс.Переводчик

 Все блоги и клубы сервисов Яндекса 

Яндекс.Переводчик теперь и в MateCat
13 апреля, 11:05

Яндекс.Переводчик позволяет решать не только бытовые задачи, он не менее полезен и профессионалам. Недавно наш API был интегрирован в инструмент, который помогает переводчикам во всём мире быстро и качественно выполнять свою работу, – опенсорсный CAT-tool под названием MateCat.

MateCat – отличный пример того, насколько эффективна совместная работа машины и человека. С помощью этого инструмента переводчики могут моментально получить черновой вариант текста, а после править его в интерфейсе программы. Помимо машинного перевода, для пользователей доступны и другие полезные функции: автоматический корректор, возможность запоминания программой наиболее часто встречающихся фраз и предложений, настраиваемый словарь. Теперь благодаря Яндекс.Переводчику в MateCat можно работать и с языками народов России.

Попробуйте сами: https://www.matecat.com

1 комментарий
API,MateCat,CAT-tools
Три новых языка: бирманский, кхмерский и лаосский
4 апреля, 17:33



На нашем веб-сервисе сегодня появились три новых языка: бирманский, кхмерский и лаосский.

Языки Индокитая на первый взгляд похожи между собой и все вместе на китайский язык. Слова в них в основном односложные, грамматические отношения выражаются служебными элементами, в большинстве языков есть тоны. Часто есть по несколько слов для местоимений "ты" и "я" в зависимости от степени вежливости, которую говорящий хочет выразить собеседнику. Также для этих языков характерны счетные слова – специальные слова, которые надо добавлять к числительному в зависимости от того, какие предметы вы считаете: людей, книги, деревья, овальные предметы или то, что имеет ноги (например, животные, насекомые и стулья). Кроме того, во многих языках Индокитая, особенно с давней литературной традицией, есть множество китайских слов. 

При этом бирманский, кхмерский и лаосский принадлежат к совершенно разным языковым семьям. Только бирманский – отдаленный родственник китайского. Кхмерский язык родственен вьетнамскому и имеет многочисленных родственников в Индии. Лаосский язык очень похож на тайский, и они связаны, наоборот, с австронезийскими языками, на которых говорят от Малайзии до Новой Зеландии и Мадагаскара. 

Кхмерский, бирманский и лаосский языки имеют разные системы письма, но они все восходят к письму брахми, которое дало начало множеству письменностей Индии и Индокитая. В них основными знаками обозначаются согласные, а для гласных используются дополнительные значки. 

Нет комментариев
новые языки,бирманский,кхмерский,лаосский
У нас очередное пополнение: коса и амхарский
7 ноября 2016, 15:05



Только в одном месте на земле есть языки, в которых есть так называемые «щелкающие» звуки, или «кликсы». Это языки бушменов и готтентотов (сейчас эту семью принято называть койсанской), аборигенных жителей Южной Африки, и самые южные языки банту, в которых кликсы появились в результате контактов с койсанскими языками. Самые крупные из этих языков — это зулу (12 миллионов) и коса (8 миллионов человек); они входят в число 11 официальных языков Южно-Африканской Республики.

Кликсы — это примерно такие звуки, которые мы производим, когда щелкаем языком, только в этих языках они используются как обычные согласные. Они произносятся не на выдохе, как все остальные звуки, а на вдохе. В транскрипции их принято обозначать специальными знаками в зависимости от того, где во рту они образуются — например, ǃ (это не восклицательный знак, а специальный символ), ǀ, ǁ. Кроме того, они могут быть носовыми, придыхательными, глоттализованными и так далее. В коса различается 18 щелкающих согласных, в зулу — 15 (это далеко не предел — в некоторых койсанских языках их число доходит до 80). В орфографии для них используют более привычные буквы c, x, q в сочетании с n для обозначения носового произношения, h для придыхания и т. д. Щелкающий согласный есть в названии самого языка коса (isiXhosa), — латеральный (то есть произносимый боковой частью языка, как наше «л») придыхательный кликс, ничего сложного.

В отношении грамматики коса — типичный язык банту. Сам язык называется isiXhosa, народ коса будет amaXhosa, а один его представитель — umXhosa. Самым, по-видимому, известным umXhosa был борец с апартеидом и первый чернокожий президент ЮАР Нельсон Мандела.

Амхарский язык — официальный язык Эфиопии; семитский язык, близкий к арабском и ивриту. Он записывается с помощью особого эфиопского письма — слоговой системы письменности, которая существует уже более тысячи лет. В ней каждый символ соответствует сочетанию согласного и гласного: например, ባ — это ba, ቤ — be, ቦ — bo, ቧ — bwa и так далее. С другой стороны, в принятой орфографии не обозначается удвоение согласных, которое важно для амхарского языка. Все это, конечно, создавало особые проблемы при сборке машинного перевода. Но по крайней мере, в отличие от некоторых других систем письма, на слова текст делится легко — двоеточием.

Амхарский считают своим священным языком растафарианцы. Само слово «Растафари» — это амхарское ራስ፡ተፈሪ, сочетание титула ras ራስ, буквально «голова» и täfäri ተፈሪ — мирского имени последнего императора Эфиопии Хайле Селассие I.

26 комментариев
новые языки,обновление ,коса,амхарский
Мы добавили новый язык – папьяменто
5 октября 2016, 18:07

Папьяменто – креольский язык, в основе которого лежит португальский, испанский, нидерландский, английский, французский и даже африканский. Он является официальным на островах Аруба, Кюрасао и Бонэйр наравне с нидерландским. Эти острова расположены в Южной части Карибского бассейна, рядом в Венесуэлой, и, несмотря на удаленность от Европы, до сих пор входят в Королевство Нидерланды.

Всего на папьяменто говорит около 270 тысяч человек (по данным справочника «Ethnologue: Languages of the World»).

Существует несколько теорий происхождения этого языка. Согласно наиболее распространенной, папьяменто – побочный продукт активной колониальной политики Европы. Он начал зарождаться на базе упрощенного креольского, который использовали рабы в португальских колониях в Африке. Оттуда рабы принесли язык на остров Кюрасао, где большая часть населения уже говорила на смеси сефардского и португальского (около половины населения Кюрасао составляли сефардские евреи из Голландии вследствие того, что их сообществу принадлежало 20% акций Вест-индийской Компании). В дальнейшем языки ещё больше смешались и подверглись сильному влиянию испанского, который был также завезён колонизаторами.

Первый найденный письменный документ на папьяменто – любовное письмо 1776 года. Уже в 1875 году был издан официальный папьяменто-нидерландский словарь. Сегодня на папьяменто не только выпускается печатная продукция, но и ведется ТВ- и радиовещание.

3 комментария
папьяменто ,новые языки,переводчик
На Яндекс.Переводчике появились марийский и горномарийский языки
6 сентября 2016, 16:02

Мы запустили машинный перевод для марийского и горномарийского языков. Теперь пользователи могут переводить слова и фразы с любого из этих языков на 86 других — и наоборот.

Марийский (или лугово-восточный марийский) и горномарийский языки — это, как и русский, государственные языки Республики Марий Эл. На них разговаривают также в Башкортостане, Татарстане, Кировской области и некоторых других регионах России. Хотя марийский и горномарийский языки похожи, одно и то же слово может звучать в этих языках совсем по-разному, есть отличия в правилах грамматики, не совпадают и алфавиты. Поэтому работа над машинными переводами для этих двух языков велась параллельно. Пока оба перевода работают в бета-версии, так что возможны недочёты.

Работа по созданию марийско-русского перевода велась с тесном сотрудничестве с региональными организациями – Марийским научно-исследовательским институтом языка, литературы и истории им. В.М. Васильева (МарНИИЯЛИ) и Республиканским центром марийской культуры (РЦМК), обеспечивших лингвистическую поддержку и подготовку эталонных марийско-русских переводов для оценки качества перевода. Помимо этого, руководство МарНИИЯЛИ (директор А.С.Казимов) предоставило права на использование большой словарной базы Марийско-Русского Словаря, а Андрей Чемышев вместе с группой сотрудников РЦМК собрал дополнительный корпус двуязычных русско-марийских текстов. Благодаря этим лексическим ресурсам, нам удалось значительно увеличить объем и качество данных, используемых для построения статистических моделей, и, тем самым, повысить итоговое качество машинного перевода. 

5 комментариев
марийский,обновление ,горномарийский
Яндекс.Переводчик освоил 11 новых языков
25 июля 2016, 18:15



Говорят, что бесконечно можно смотреть на три вещи: огонь, воду и то, как команда Яндекс.Переводчика осваивает новые языки. В общем, по старой традиции начинаем неделю с хорошей новости.
С сегодняшнего дня список языков, которые поддерживает наш сервис, увеличился на целых 11 пунктов.

Мы добавили: 
• идиш, 
• малаялам,
• маори, 
• маратхи,
• непальский
• себуанский, 
• сунданский, 
• телугу,
• шотландский,
• эсперанто,
• яванский.

Про некоторые из них мы планируем рассказать подробнее в следующих постах, следите за нашими новостями!

18 комментариев
обновление ,новые языки,переводчик,идиш,малаялам,маори,маратхи,непальский,себуанский,сунданский,шотландский,телугу,эсперанто,яванский
Переведем по фото
7 июля 2016, 16:29

Теперь и веб-версия Яндекс.Переводчика научилась распознавать текст на картинках. Новая функция поможет перевести с иностранного языка комикс, график с подписями или, например, скан документа — достаточно загрузить изображение на translate.yandex.ru.

Доступно три режима распознавания текста: по словам, по строчкам и по блокам. 

10 комментариев
перевод,фотоперевод,фото,OCR,компьютерное зрение,обновление ,десктоп,веб
Теперь 74!
16 мая 2016, 18:49

Может для кого-то понедельник не самый продуктивный день, но уж точно не для нас. Начинаем неделю с релиза сразу 6 новых языков, распространенных в Индии: мы добавили бенгальский, гуджарати, каннада, пунджаби, сингальский и тамильский языки. Пока они доступны только на сайте, но в ближайших обновлениях появятся и в мобильных приложениях.

Кстати, не удивляйтесь, что языков так много, – в Индии только официальных целых 22! Нам есть куда расти :) 

14 комментариев
новые языки,переводчик,обновление
Переводим на удмуртский!
7 апреля 2016, 18:02

Мы рады поделиться с вами новостью – теперь Яндекс.Переводчик поддерживает удмуртский язык. 
Хотим поблагодарить за помощь в работе над этим проектом составителей корпуса удмуртского языка Тимофея Архангельского и Марию Медведеву, а также участницу рабочей группы "МУШ" и сообщества "Удмуртлык" Ольгу Урасинову.

4 комментария
новые языки,перевод,переводчик
Весна – время обновлений
23 марта 2016, 18:00

У нас как раз есть несколько отличных:

  • Теперь под полем ввода текста мы показываем не только похожие, но и родственные слова.
  • Кроме того, с сегодняшнего дня вы сможете подсматривать примеры использования интересующих вас слов.
     

2 комментария
переводчик,веб-интерфейс
Перевод сайтов на веб-сервисе стал еще удобнее
15 февраля 2016, 17:25
  • Во-первых, наш новый поп-ап позволяет быстро подсмотреть исходный текст, достаточно навести курсор на интересующее вас предложение.
  • Во-вторых, если вы нашли неточность или ошибку, вы можете предложить нам свой вариант перевода.
  • Ну, и в-третьих, это красиво!

Нет комментариев
Вы можете помочь нам стать еще лучше! 
9 февраля 2016, 17:46

Мы добавили на веб-сервис режим редактирования перевода. 
Если вы заметили неправильный перевод, просто нажмите на карандаш и предложите свой вариант. 

Нет комментариев
редактирование текста
Индия зовёт!
29 декабря 2015, 17:51

Люди, как говорится, делятся на две категории.

У кого-то Новый год ассоциируется с мандаринами и ёлкой, а кто-то традиционно сбегает накануне 31-го декабря к кокосам и пальмам. Что ж, у нас есть подарок для всех!

Сегодня мы добавили на сервис два самых распространенных индоевропейских языка, на которых суммарно говорит более полумиллиарда человек: хинди и урду.

Теперь вы сможете не только открыть для себя мир увлекательного индийского интернета и заказать, к примеру, оригинальный сари в подарок, но и объясниться с местными, если вас занесло в деревушку на отшибе Гоа. 

2 комментария
Переводчик для Android выбирается за пределы приложения
15 декабря 2015, 17:28

Cначала Переводчик работал только со словами, которые вы в нём печатали, затем стал переводить сайты, а теперь помогает понять, что написано в других приложениях на вашем устройстве. Чтобы перевести незнакомый текст, выделите его и выберите Яндекс.Переводчик в контекстном меню.
Мы смогли добавить эту возможность благодаря нововведениям Android. Обратите внимание, что она работает только на устройствах с Android 6.0 и её пока поддерживают не все приложения.

3 комментария
Интернет без языковых барьеров в вашем мобильном
1 декабря 2015, 19:15

Мы сделали  информацию еще доступнее: теперь функция перевода сайтов появилась и в приложени для IOS. Скорее обновляйтесь! 

Нет комментариев
Больше никаких ошибок!
19 ноября 2015, 12:58

Проверка правописания вернулась на веб-сервис  

Функция доступна для следующих языков: русский, английский, украинский и казахский.


Теперь при наборе текст вновь автоматически проверяется на наличие ошибок и опечаток. Слова с ошибками подчеркиваются красной линией. При клике левой кнопкой мыши на подчеркнутое слово сервис предложит правильные варианты написания, из которых можно выбрать наиболее подходящий.


 

2 комментария
Начинаем понедельник с бодрой новости!
2 ноября 2015, 13:12

Мобильное приложение Яндекс.Переводчик для Android научилось переводить сайты.
Также новая версия позволяет озвучивать действия пользователя и события, что делает её удобной для людей с физическими ограничениями. Подробнее о специальных возможностях Android можно узнать по ссылке: https://support.google.com/accessibility/android/answ..

#обновление

 

2 комментария
Отличная новость: мы добавили новую клавиатуру!
15 октября 2015, 11:28

Приглашаем потестировать и поделиться своими отзывами

На текущий момент клавиатура поддерживает белорусский, немецкий, английский, испанский, финский, французский, итальянский, казахский, русский, турецкий, татарский, украинский, эстонский языки. В будущем мы планируем расширять список языков. 

4 комментария
Мы обновили дизайн сервиса!
30 сентября 2015, 16:58

34 комментария
+1 в карму!
22 сентября 2015, 17:28

Мы продолжаем заниматься созданием машинного перевода для языков народов Российской Федерации. Рады поделиться с вами очередным релизом – сегодня мы запустили экспериментальную версию башкирского перевода.

Теперь наш сервис поддерживает 64 языка. И мы обещаем не останавливаться на достигнутом

1 комментарий