Блог Переводчика

Это официальный блог сервиса Яндекс.Переводчик. Здесь мы будем рассказывать о том, что нового произошло на нашем сервисе, какие изменения и улучшения мы внесли, а также о наших достижениях в области машинного перевода.

Мы всегда рады пожеланиям и замечаниям наших пользователей!

Команда сервиса Яндекс.Переводчик

 Все блоги и клубы сервисов Яндекса 

У нас очередное пополнение: коса и амхарский
7 ноября 2016, 15:05



Только в одном месте на земле есть языки, в которых есть так называемые «щелкающие» звуки, или «кликсы». Это языки бушменов и готтентотов (сейчас эту семью принято называть койсанской), аборигенных жителей Южной Африки, и самые южные языки банту, в которых кликсы появились в результате контактов с койсанскими языками. Самые крупные из этих языков — это зулу (12 миллионов) и коса (8 миллионов человек); они входят в число 11 официальных языков Южно-Африканской Республики.

Кликсы — это примерно такие звуки, которые мы производим, когда щелкаем языком, только в этих языках они используются как обычные согласные. Они произносятся не на выдохе, как все остальные звуки, а на вдохе. В транскрипции их принято обозначать специальными знаками в зависимости от того, где во рту они образуются — например, ǃ (это не восклицательный знак, а специальный символ), ǀ, ǁ. Кроме того, они могут быть носовыми, придыхательными, глоттализованными и так далее. В коса различается 18 щелкающих согласных, в зулу — 15 (это далеко не предел — в некоторых койсанских языках их число доходит до 80). В орфографии для них используют более привычные буквы c, x, q в сочетании с n для обозначения носового произношения, h для придыхания и т. д. Щелкающий согласный есть в названии самого языка коса (isiXhosa), — латеральный (то есть произносимый боковой частью языка, как наше «л») придыхательный кликс, ничего сложного.

В отношении грамматики коса — типичный язык банту. Сам язык называется isiXhosa, народ коса будет amaXhosa, а один его представитель — umXhosa. Самым, по-видимому, известным umXhosa был борец с апартеидом и первый чернокожий президент ЮАР Нельсон Мандела.

Амхарский язык — официальный язык Эфиопии; семитский язык, близкий к арабском и ивриту. Он записывается с помощью особого эфиопского письма — слоговой системы письменности, которая существует уже более тысячи лет. В ней каждый символ соответствует сочетанию согласного и гласного: например, ባ — это ba, ቤ — be, ቦ — bo, ቧ — bwa и так далее. С другой стороны, в принятой орфографии не обозначается удвоение согласных, которое важно для амхарского языка. Все это, конечно, создавало особые проблемы при сборке машинного перевода. Но по крайней мере, в отличие от некоторых других систем письма, на слова текст делится легко — двоеточием.

Амхарский считают своим священным языком растафарианцы. Само слово «Растафари» — это амхарское ራስ፡ተፈሪ, сочетание титула ras ራስ, буквально «голова» и täfäri ተፈሪ — мирского имени последнего императора Эфиопии Хайле Селассие I.

15 комментариев
новые языки,обновление ,коса,амхарский
Мы добавили новый язык – папьяменто
5 октября 2016, 18:07

Папьяменто – креольский язык, в основе которого лежит португальский, испанский, нидерландский, английский, французский и даже африканский. Он является официальным на островах Аруба, Кюрасао и Бонэйр наравне с нидерландским. Эти острова расположены в Южной части Карибского бассейна, рядом в Венесуэлой, и, несмотря на удаленность от Европы, до сих пор входят в Королевство Нидерланды.

Всего на папьяменто говорит около 270 тысяч человек (по данным справочника «Ethnologue: Languages of the World»).

Существует несколько теорий происхождения этого языка. Согласно наиболее распространенной, папьяменто – побочный продукт активной колониальной политики Европы. Он начал зарождаться на базе упрощенного креольского, который использовали рабы в португальских колониях в Африке. Оттуда рабы принесли язык на остров Кюрасао, где большая часть населения уже говорила на смеси сефардского и португальского (около половины населения Кюрасао составляли сефардские евреи из Голландии вследствие того, что их сообществу принадлежало 20% акций Вест-индийской Компании). В дальнейшем языки ещё больше смешались и подверглись сильному влиянию испанского, который был также завезён колонизаторами.

Первый найденный письменный документ на папьяменто – любовное письмо 1776 года. Уже в 1875 году был издан официальный папьяменто-нидерландский словарь. Сегодня на папьяменто не только выпускается печатная продукция, но и ведется ТВ- и радиовещание.

3 комментария
папьяменто ,новые языки,переводчик
На Яндекс.Переводчике появились марийский и горномарийский языки
6 сентября 2016, 16:02

Мы запустили машинный перевод для марийского и горномарийского языков. Теперь пользователи могут переводить слова и фразы с любого из этих языков на 86 других — и наоборот.

Марийский (или лугово-восточный марийский) и горномарийский языки — это, как и русский, государственные языки Республики Марий Эл. На них разговаривают также в Башкортостане, Татарстане, Кировской области и некоторых других регионах России. Хотя марийский и горномарийский языки похожи, одно и то же слово может звучать в этих языках совсем по-разному, есть отличия в правилах грамматики, не совпадают и алфавиты. Поэтому работа над машинными переводами для этих двух языков велась параллельно. Пока оба перевода работают в бета-версии, так что возможны недочёты.

Работа по созданию марийско-русского перевода велась с тесном сотрудничестве с региональными организациями – Марийским научно-исследовательским институтом языка, литературы и истории им. В.М. Васильева (МарНИИЯЛИ) и Республиканским центром марийской культуры (РЦМК), обеспечивших лингвистическую поддержку и подготовку эталонных марийско-русских переводов для оценки качества перевода. Помимо этого, руководство МарНИИЯЛИ (директор А.С.Казимов) предоставило права на использование большой словарной базы Марийско-Русского Словаря, а Андрей Чемышев вместе с группой сотрудников РЦМК собрал дополнительный корпус двуязычных русско-марийских текстов. Благодаря этим лексическим ресурсам, нам удалось значительно увеличить объем и качество данных, используемых для построения статистических моделей, и, тем самым, повысить итоговое качество машинного перевода. 

3 комментария
марийский,обновление ,горномарийский
Яндекс.Переводчик освоил 11 новых языков
25 июля 2016, 18:15



Говорят, что бесконечно можно смотреть на три вещи: огонь, воду и то, как команда Яндекс.Переводчика осваивает новые языки. В общем, по старой традиции начинаем неделю с хорошей новости.
С сегодняшнего дня список языков, которые поддерживает наш сервис, увеличился на целых 11 пунктов.

Мы добавили: 
• идиш, 
• малаялам,
• маори, 
• маратхи,
• непальский
• себуанский, 
• сунданский, 
• телугу,
• шотландский,
• эсперанто,
• яванский.

Про некоторые из них мы планируем рассказать подробнее в следующих постах, следите за нашими новостями!

18 комментариев
обновление ,новые языки,переводчик,идиш,малаялам,маори,маратхи,непальский,себуанский,сунданский,шотландский,телугу,эсперанто,яванский
Переведем по фото
7 июля 2016, 16:29

Теперь и веб-версия Яндекс.Переводчика научилась распознавать текст на картинках. Новая функция поможет перевести с иностранного языка комикс, график с подписями или, например, скан документа — достаточно загрузить изображение на translate.yandex.ru.

Доступно три режима распознавания текста: по словам, по строчкам и по блокам. 

10 комментариев
перевод,фотоперевод,фото,OCR,компьютерное зрение,обновление ,десктоп,веб
Теперь 74!
16 мая 2016, 18:49

Может для кого-то понедельник не самый продуктивный день, но уж точно не для нас. Начинаем неделю с релиза сразу 6 новых языков, распространенных в Индии: мы добавили бенгальский, гуджарати, каннада, пунджаби, сингальский и тамильский языки. Пока они доступны только на сайте, но в ближайших обновлениях появятся и в мобильных приложениях.

Кстати, не удивляйтесь, что языков так много, – в Индии только официальных целых 22! Нам есть куда расти :) 

14 комментариев
новые языки,переводчик,обновление
Переводим на удмуртский!
7 апреля 2016, 18:02

Мы рады поделиться с вами новостью – теперь Яндекс.Переводчик поддерживает удмуртский язык. 
Хотим поблагодарить за помощь в работе над этим проектом составителей корпуса удмуртского языка Тимофея Архангельского и Марию Медведеву, а также участницу рабочей группы "МУШ" и сообщества "Удмуртлык" Ольгу Урасинову.

4 комментария
новые языки,перевод,переводчик
Весна – время обновлений
23 марта 2016, 18:00

У нас как раз есть несколько отличных:

  • Теперь под полем ввода текста мы показываем не только похожие, но и родственные слова.
  • Кроме того, с сегодняшнего дня вы сможете подсматривать примеры использования интересующих вас слов.
     

2 комментария
переводчик,веб-интерфейс
Перевод сайтов на веб-сервисе стал еще удобнее
15 февраля 2016, 17:25
  • Во-первых, наш новый поп-ап позволяет быстро подсмотреть исходный текст, достаточно навести курсор на интересующее вас предложение.
  • Во-вторых, если вы нашли неточность или ошибку, вы можете предложить нам свой вариант перевода.
  • Ну, и в-третьих, это красиво!

Нет комментариев
Вы можете помочь нам стать еще лучше! 
9 февраля 2016, 17:46

Мы добавили на веб-сервис режим редактирования перевода. 
Если вы заметили неправильный перевод, просто нажмите на карандаш и предложите свой вариант. 

Нет комментариев
редактирование текста
Индия зовёт!
29 декабря 2015, 17:51

Люди, как говорится, делятся на две категории.

У кого-то Новый год ассоциируется с мандаринами и ёлкой, а кто-то традиционно сбегает накануне 31-го декабря к кокосам и пальмам. Что ж, у нас есть подарок для всех!

Сегодня мы добавили на сервис два самых распространенных индоевропейских языка, на которых суммарно говорит более полумиллиарда человек: хинди и урду.

Теперь вы сможете не только открыть для себя мир увлекательного индийского интернета и заказать, к примеру, оригинальный сари в подарок, но и объясниться с местными, если вас занесло в деревушку на отшибе Гоа. 

2 комментария
Переводчик для Android выбирается за пределы приложения
15 декабря 2015, 17:28

Cначала Переводчик работал только со словами, которые вы в нём печатали, затем стал переводить сайты, а теперь помогает понять, что написано в других приложениях на вашем устройстве. Чтобы перевести незнакомый текст, выделите его и выберите Яндекс.Переводчик в контекстном меню.
Мы смогли добавить эту возможность благодаря нововведениям Android. Обратите внимание, что она работает только на устройствах с Android 6.0 и её пока поддерживают не все приложения.

3 комментария
Интернет без языковых барьеров в вашем мобильном
1 декабря 2015, 19:15

Мы сделали  информацию еще доступнее: теперь функция перевода сайтов появилась и в приложени для IOS. Скорее обновляйтесь! 

Нет комментариев
Больше никаких ошибок!
19 ноября 2015, 12:58

Проверка правописания вернулась на веб-сервис  

Функция доступна для следующих языков: русский, английский, украинский и казахский.


Теперь при наборе текст вновь автоматически проверяется на наличие ошибок и опечаток. Слова с ошибками подчеркиваются красной линией. При клике левой кнопкой мыши на подчеркнутое слово сервис предложит правильные варианты написания, из которых можно выбрать наиболее подходящий.


 

2 комментария
Начинаем понедельник с бодрой новости!
2 ноября 2015, 13:12

Мобильное приложение Яндекс.Переводчик для Android научилось переводить сайты.
Также новая версия позволяет озвучивать действия пользователя и события, что делает её удобной для людей с физическими ограничениями. Подробнее о специальных возможностях Android можно узнать по ссылке: https://support.google.com/accessibility/android/answ..

#обновление

 

2 комментария
Отличная новость: мы добавили новую клавиатуру!
15 октября 2015, 11:28

Приглашаем потестировать и поделиться своими отзывами

На текущий момент клавиатура поддерживает белорусский, немецкий, английский, испанский, финский, французский, итальянский, казахский, русский, турецкий, татарский, украинский, эстонский языки. В будущем мы планируем расширять список языков. 

4 комментария
Мы обновили дизайн сервиса!
30 сентября 2015, 16:58

34 комментария
+1 в карму!
22 сентября 2015, 17:28

Мы продолжаем заниматься созданием машинного перевода для языков народов Российской Федерации. Рады поделиться с вами очередным релизом – сегодня мы запустили экспериментальную версию башкирского перевода.

Теперь наш сервис поддерживает 64 языка. И мы обещаем не останавливаться на достигнутом

1 комментарий
Обновление в квадрате
25 августа 2015, 17:24

Хм... вы тоже слышали, будто за двумя зайцами погонишься, ни одного не поймаешь? Это точно не про нас – сегодня мы готовы порадовать вас сразу двумя долгожданными обновлениями!

Что нового появилось в IOS-приложении:

  • Мы добавили функцию голосового ввода для русского, английского и турецкого языков.
  • Появились подсказки при наборе слов на следующих языках: африкаанс, валлийский, баскский, ирландский, галисийский, гаитянский, казахский, киргизский, латынь, малагасийский, монгольский, суахили, таджикский, тагальский, узбекский.  

Обновления в Android-приложении:

  • Как обещали, мы научили приложение распознавать и переводить текст с изображений! Функция работает для 11 популярных языков. 
  • Переводчик выучил новые языки: африкаанс, баскский, валлийский, ирландский, галисийский, гаитянский креольский, латынь, малагасийский, монгольский, суахили, тагальский и узбекский. 
  • Мы также добавили подсказки при наборе слов на следующих языках: африкаанс, валлийский, баскский, ирландский, галисийский, гаитянский, казахский, киргизский, латынь, малагасийский, монгольский, суахили, таджикский, тагальский, узбекский.
  • Появилась возможность показывать переведенный текст на весь экран.
  • Стабилизирована работа приложения в офлайн-режиме.
2 комментария
Говорите, мы вас слушаем!
3 августа 2015, 18:31

Яндекс.Переводчик стал еще удобнее в использовании - с сегодняшнего дня функция голосового ввода доступна на десктопе не только для пользователей Chrome, но и для Яндекс.Браузера, Firefox и Opera. Мы научились распознавать русскую, английскую и турецкую речь, благодаря использованию технологии SpeechKit – https://tech.yandex.ru/speechkit.

Кстати, эта технология разработана компанией Яндекс и включает в себя не просто распознавание, но и выделение смысловых объектов в произносимом тексте, без чего было бы невозможно различить "Любовь Владимировну" и "первую любовь", а что еще страшнее ­– "несу разные вещи" и "несуразные вещи"

 

Помимо Яндекс.Переводчика, на базе технологии SpeechKit работает Яндекс.Навигатор.

 

2 комментария