Как победить морников: Яндекс запустил гибридную систему перевода

Яндекс.Переводчик начал использовать гибридную систему перевода. К статистическому переводчику, который мы применяем уже давно, добавилась технология перевода на основе нейронной сети. Теперь перевод выполняют обе модели, а затем алгоритм на основе метода машинного обучения CatBoost сравнивает результаты и предлагает лучший.

При переводе нейросеть не разбивает тексты на отдельные слова и фразы — она обрабатывает целые предложения. За счёт этого текст хорошо читается: порой даже можно подумать, что его написал человек. Статистический переводчик так не умеет, зато хорошо запоминает и переводит редкие и сложные выражения. Работая вместе, две системы компенсируют недостатки друг друга.

Статистический перевод

Есть много способов обучить машину переводу с одного языка на другой. Например, можно дать ей словари и грамматики разных языков: с их помощью она освоит правила. Или можно показать ей много параллельных текстов. Сравнивая их, машина научится находить соответствия — например, поймёт, что слова dog и собака являются вероятными переводами друг друга. В основе такого подхода лежат не правила, а статистика, поэтому он называется статистическим.

С момента запуска Яндекс.Переводчик использует статистическую систему. При переводе она разделяет предложения на кусочки (отдельные слова и фразы) и для каждого кусочка подбирает все возможные переводы с указанием их вероятности. Затем система составляет из переведённых фрагментов разные варианты нового предложения. Выбирают тот вариант, который содержит переводы с высокими вероятностями и в котором фрагменты хорошо сочетаются друг с другом.

У статистического переводчика есть как достоинства, так и недостатки. С одной стороны, он хорошо запоминает редкие и сложные слова и фразы. Если они встречались в параллельных текстах, переводчик запомнит их и впредь будет переводить правильно. С другой стороны, результат перевода бывает похож на собранный пазл: общая картина вроде бы понятна, но если присмотреться, то видно, что она составлена из отдельных кусочков.

Нейросетевой перевод

С сегодняшнего дня наряду со статистической системой мы используем в Яндекс.Переводчике нейронную сеть. Модели на нейронных сетях отлично справляются с обработкой естественной информации, например голоса или картинок. Задача перевода — превратить текст на одном языке в текст на другом языке, сохранив содержание и смысл. Текст — это тоже естественная информация, поэтому для нейронной сети такая задача вполне по силам.

Как и статистический переводчик, нейронная сеть анализирует массив параллельных текстов и учится находить в них закономерности. Сам перевод, однако, устроен по-другому. Нейросеть работает не со словами и фразами, а с более крупными единицами — предложениями. Она получает на вход предложение на одном языке, а на выходе выдаёт предложение на другом языке. Дробления на слова и фразы не происходит — в нём нет необходимости.

Такой подход позволяет учесть смысловые связи внутри предложения — иными словами, понять его контекст. Слова и фразы не существуют в вакууме — они сочетаются с другими словами и фразами, образуя новые смыслы. Нейросеть улавливает смыслы даже в случае, если слова, которые их передают, находятся в разных частях предложения. Важность контекста сложно переоценить — именно на него в первую очередь обращают внимание люди-переводчики.

Модель языка

Модель языка содержит список всех употребляемых в языке слов и словосочетаний с указанием частоты их использования. Она обеспечивает связность текста и в статистическом, и в нейронном переводе. Её можно использовать и для задач, не связанных с переводом. Когда вы печатаете сообщение с помощью Яндекс.Клавиатуры, машина пытается предсказать, какое слово вы наберёте следующим. Например, если вы набрали «привет, как», она поймёт, что продолжением могут быть слова «дела» или «ты». Это тоже результат работы модели языка.

Поскольку нейросеть работает не с фрагментами, а с предложениями целиком, перевод получается более связным и «гладким». Чтобы избежать несогласований — например, папа пошла или сильный боль, — Яндекс.Переводчик проводит дополнительную проверку. Предложение, переведённое нейросетью, проходит через модель языка — так называют свод знаний о языке, накопленный системой. Если в перевод вкрались грамматические ошибки, модель их исправит.

Гибридная система

У нейросетевого перевода тоже есть свои недостатки. Если по каким-то причинам нейронной сети трудно перевести то или иное предложение — а такое время от времени случается, — она поведёт себя примерно как студент на экзамене: начнёт что-то выдумывать от себя в надежде угадать правильный ответ.

Кроме того, нейросеть не всегда хорошо справляется с переводом мало распространённых имён, топонимов и других редких слов. Зато для статистического перевода, как вы помните, это нетрудная задача — если слово было в параллельных текстах, машина его запомнит. Мы решили объединить два подхода и создать гибридную систему, которая объединяет статистический и нейросетевой перевод. Работая вместе, две системы компенсируют недостатки друг друга.

Когда Яндекс.Переводчик получает от пользователя текст, он отдаёт его на перевод обеим системам — и нейронной сети, и статистическому переводчику. Затем алгоритм, основанный на методе обучения CatBoost, оценивает, какой перевод лучше. При выставлении оценки учитываются десятки факторов — от длины предложения (короткие фразы лучше переводит статистическая модель) до синтаксиса. Перевод, признанный лучшим, показывается пользователю.

Сейчас гибридная система используется для переводов с английского языка на русский. Это самое популярное направление: на него приходится около 80% всех запросов к Яндекс.Переводчику. В ближайшие месяцы мы включим систему и для других направлений. Чтобы было интереснее, мы добавили в веб-версию Переводчика переключатель — с его помощью можно сравнить гибридный и статистический переводы и понять, чем они различаются.

168 комментариев
Олег Хамбиков
14 сентября 2017, 10:59
Постоянно пользуюсь Я.переводчиком, спасибо за улучшения.
Прочитал новость, решил попробовать.
Вот исходная фраза (взята из твиттер- аккаунта English native speakers):
My first early flight for some time. Looking forward to the sunrise.
Нейросетевой перевод: Мой первый ранний рейс на некоторое время. Жду восхода солнца.
Статистический перевод: Мой первый ранний рейс в течение некоторого времени. С нетерпением жду рассвета.
Наверное, нужно кнопочку сделать "лучше-хуже", чтобы сеть обучалась
Обновлено 14 сентября 2017, 11:03
Олег Хамбиков,
здравствуйте.
Спасибо, что пользуетесь нашим сервисом! Вы правы, для обучения обратная связь нам очень полезна. Вы можете пожаловаться на тот вариант, который вам нравится меньше, нажав на иконку с большим пальцем, направленным вниз. 
мипткуащшпиркушаприо
25 сентября 2017, 10:15
Олег Хамбиков,
А вот перевод этого предложения переводчиком Promt и он наиболее близок к оригиналу, чем у вас. "Мой первый ранний полет в течение некоторого времени. Нетерпеливое ожидание восхода солнца". Так как перед словом  "sunrise" - солнце стоит неопределённый артикль the,  то и переводится оно должно так, а не рассвет.
Vladislav Ivanovitch
2 ноября 2017, 10:16
Татьяна,
Татьяна, здравствуйте! Вы отметили, что нейросетевой подход начинает гадать, когда мало аналогов.  Мне удалось разработать теорию систем коллективногго интеллекта и на ее основе  новый подход, когда коллектив нейросетей дает в этом случае  ответ "не знаю" и сложный случай может быть передан другому алгоритму. Первую публикацию можно посмотреть здесь http://trudy.mai.ru/published.php?ID=77251 . Могу приехать к вам и рассказать подробнее об этом подходе. С уважением,  Протасов Владислав protonus@yandex.ru
мипткуащшпиркушаприо,
вообще-то, "the" это определённый артикль :), а неопределённый, это "а"
мипткуащшпиркушаприо
6 ноября 2017, 03:25
Amoksiklav,
Много соображаешь. Приставка "The" это часть речи, используемая для выражения категории определённости/неопределённости.
мипткуащшпиркушаприо,


:))) С каких это пор "приставка" стала частью речи?!?!?!?! Что-то у тебя с этим полная путаница.
Я не собираюсь обучать тебя основам английского языка, ты его или учил очень давно или очень плохо. так и быть, дам тебе ссылочку на тему про артикли в английском языке https://guruenglish.ru/artikli-v-anglijskom-yazyke/
пользуйся :)
ну не знаю....
с русского на англ так себе результат, похоже тут гибрид пока не работает...


Born in the forest herringbone, in the forest it grew, winter and summer slim green was
ovg2005,
здравствуйте!
В посте указано, что гибридный перевод работает на данный момент только для англо-русского направления. В будущем мы планируем подключить и остальные направления. 
Обновлено 14 сентября 2017, 11:45
мипткуащшпиркушаприо
25 сентября 2017, 10:31
ovg2005,
Promt. В лесу родилась елочка, в лесу она росла, зимой и летом стройная зеленая была.  In the wood the fir-tree was born, in the wood it grew, in the winter and in the summer slender green was. Которое переводчики от Yandex и Google переводят одинаково. Яндекс. В лесу родилась елочка, в лесу она росла, зимой и летом стройная зеленая была. Где Гугл переводит без склонений. В лесу рождалась елка, в лесу она росла, зимой и летом стройный зеленый был, как узбек мигрант.
Станислав Р.
14 сентября 2017, 11:41
Ребята, это замечательно, что вы не забрасываете свой переводчик и продолжаете его улучшать. Но почему вы это делаете только после того, как это сделает Гугл? Почему нельзя было сделать это раньше на полгода? Как можно перегнать конкурента, если вы за ним волочитесь? :)



Без обид, я не спорю, что у вас свой CatBoost и т. д. Но на выходе ведь те же яйца получаются. Это не к команде переводчика посыл, а в целом. В частности, к команде поиска.
Станислав Р.,
здравствуйте!
Наша система перевода отличается от конкурентов — мы берём лучшее из двух подходов, что помогает, как выше описано, справиться с типичными проблемами, возникавшими при работе исключительно с нейросетями. Ну и, как вы верно заметили, у нас есть уникальный классификатор на основе CatBoost :)
Станислав Р.
14 сентября 2017, 13:52
Татьяна,
да, точно, с "Can I have a banana?" у Гугла проблемы :)
Было бы интересно почитать сравнение вашего алгоритма с обычным статистическим переводом, как тут - https://arxiv.org/pdf/1609.08144.pdf
Саша такмаков
27 апреля 2018, 11:06
Татьяна,
Скажите пожалуйста как включить мне гибридную систему перевода?
спасибо, яндекс. английский как раз знаю. однако, временами, переводчик критично нужен при перездах по малым странам. удобная штука 
zoloto-omsk,
спасибо! 
Татьяна,
 про перевод сайта ничего не напишете? очень интересно
zoloto-omsk,
а что бы вы хотели узнать? 
Татьяна,
 есть ли возможность, пользуясь Вашей новой разработкой, поставить переводчик на другие языки так же как стоит на сайте указанном выше 
zoloto-omsk,
на данный момент нет, но в ближайшем будущем новый перевод будет доступен и для других языков. Вы сможете его использовать по API. 
а знаете, у меня вопрос: я напридумывал информации на сайте a2all.ru видел у какого-то фотографа гугловскую машину, позволяющую выбрать один из чуть ли не сотни языков. Вы не можете мне предложить подобное решение? можно как-то платно. я ранее не обращался потому что даже на родном языке многие люди мне говорили что, читая, заблудились в полёте моей фантазии, поэтому я даже не пытался переводить машиной и просил знакомых переводить по дружески, общаясь со мной и воспроизводя мои тексты так, как поняли.
однако воз и ныне там. давайте попробуем машиной перевести? 
сайт, где стоит гугловская машина вот: http://www.yacht-instructor.org/p/reports.html
картинку сделал, но Вы не предлагаете прикрепить 
Морники всем! :3
На волне недавнего поста про гугловский переводчик на пикабу проверил сокральную фразу. Яндекс оказался не патриотичен:)
Российская Федерация присоединила Крым. = Russian Federation annexed Crimea.
shevernitskiy,
сАкральную) исправляй, умник
zoloto-omsk,
я вам больше скажу, там еще ошибка в написании "непатриотичен". Странно, что вы исправляете других, а сами пишите "по-дружески" без дефиса и совершенно не утруждаете себя правильной пунктуацией и заглавными буквами (хотя почему-то "Вы" вы пишете с ними). :)
shevernitskiy,
 уф. а я уж подумал Вы ошибку сделали) умница кокойя
shevernitskiy,
а Bing перевёл "The Russian Federation has joined the Crimea"! Опять зрада!
Михаил Мамонов
14 сентября 2017, 20:06
Это идеально! Даже сленговые выражения с точностью переводит!
Владимир Миронов
14 сентября 2017, 23:39
А я думал, что Яндекс давно уже использует эту технологию и в последнее время подумывал, что ребята сдулись, смотря, в особенности на переводчик от MS.

Но теперь вижу, что перевод даже качественнее, как не удивительно. Жалко, что браузер и функция перевода web-страниц еще работает по старым алгоритмам. Смысл обновлять только в одном лишь месте? Грусть, мрак, туман :-(
Владимир Миронов,
здравствуйте! В будущем мы планируем подключить новый перевод ко всем продуктам. 
Круто!
Пользуемся.
Ценим.
Спасибо.
Stepan R.,
спасибо! 
Понимаю, что текст не самый общий, но за что так с птицами? А главное, почему перевод почти не отличается при переключении технологии?


The German capital has the largest urban population of goshawks in the world – and the best place to see this alpha predator is in the Tiergarten, the city’s 250-acre version of Kensington Gardens, where up to five pairs breed. Also look out for flocks of greenfinch, the odd great spotted woodpecker and, in summer, common redstarts and handsome pied flycatchers parading in the woodlands. But the goshawks are the main draw, even if most Berliners are unaware of their presence. Resembling buzzard-sized sparrowhawks, they can be seen swooping through the trees or quietly perched overhead. Despite their apparent confidence, they are inherently wary, melting away after revealing themselves briefly.



"Также обращайте внимание на стаи зеленушка, Нечетные большой пестрый дятел и, летом, обыкновенные горихвостки и мухоловки-красавцы гуляют в лесах."


Впрочем ни гугль, ни бинг не смогли в переводы этого текста.
гугль: 
"Также обратите внимание на стаи зеленого нечистого, нечетного великого пятнистого дятелца, а летом - обыкновенные пурпурные красавицы и красные мухоловки, торчащие в лесных массивах."
бинг:  
"Также ищите стада Гринфинч, необычный пятнистый дятел и, летом, обычные редстартс и симпатичные крошки в лесном массиве."



PS: "Ещё обратите внимание на стаи зеленушек, эксцентричных больших пёстрых дятлов и, летом, на обыкновенных горихвосток и красавиц мухоловок-пеструшек, щеголяющих по лесам."
kildor,
здравствуйте! Вероятно, в данном случае алгоритм выбрал вариант, который предоставил статистический машинный перевод, т.к. он был лучше. По этой причине перевод не меняется при смене положения переключателя. Спасибо, что поделились примером, мы собираем жалобы, это позволяет нам улучшать качество работы сервиса. 
Татьяна,
Возможно. Удивительно мне несколько вещей -- то что различия всё-таки есть (хотя и очень маленькие), и то что по отдельности любой переводчик переводит названия птиц на отлично, но стоит построить с ними предложение -- всё стремительно портится.


Пожалуйста!
Мария Суханова
15 сентября 2017, 14:58
Коллеги, извините мою тупость,  кто такие морники? Заранее спасибо.
Мария Суханова,
здравствуйте!
В тексте поста рассказывается о типичных ошибках нейронной сети, которые позволяет обойти наш новый гибридный подход. В примере нейронная сеть выдумала слово «морники» , не справившись с переводом «Good morning» :) 
Татьяна,
Читая блог, я в это не поверил, - что машина не могла перевести такой простой фразы. ☻
Переводчик в яндекс браузере при нажатии правой кнопкой мыши на выделенном тексте переводит по-старому.  Пожалуйста исправьте.
aoot,
здравствуйте! В Браузере новый перевод появится позже. 
Татьяна,
будем ждать)
на фразе "замок замок на замок, чтобы замок не замок" оно поломалось(
Oleg,
вы переводили с русского на английский? Новый перевод пока доступен только для англо-русского направления.
замок на замке замка получилось у меня в итоге
замок замок замок хорошо, вы знаете, что есть фото неудобно.
Хорошие новости! А планируется ли подключать гибридный перевод для других языковых направлений, например, для русско-украинского?
Обновлено 16 сентября 2017, 16:48
Mix Gerder,
здравствуйте! Да, а ближайшем будущем мы планируем подключить гибридный перевод для самых популярных направлений. 
Что-ж, иметь два способа перевода  - лучше чем один. Особенно, когда перевод будет более "человеческим", что бы это не значило.
gavereal,
спасибо! Более "человеческий" — более согласованный, главным образом :) 
Очень хорошее нововведение! Яндекс.Переводчик поднялся на новую планку качества.
paytin1,
спасибо! 
Это хорошо, что яндекс, как и гугл, перешел на нейронную сеть. Интересно, улучшения сделаны только в англо-русском направлении или во всех направления всех имеющихся в переводчике языков?
Борис Ц.,
здравствуйте! Пока только в англо-русском направлении, но мы готовимся к улучшению и остальных пар. 
а для фото это можно сделать ?
snailkostia,
здравствуйте! В мобильном приложении и на мобильной версии сайта при переводе текста с изображения уже работает новый перевод. 
Удалённый пользователь
18 сентября 2017, 09:01
Я постоянно пользуюсь только вашим яндекс-переводчиком, потому что гугл-переводчик  переводит зачастую непонятно как, он мягко говоря до вас ещё не дорос =)). Огромное вам спасибо за вашу работу. Желаю вам бурного развития и качественных улучшений.
RuSMaN,
спасибо! 
RuSMaN,
 Я тоже выбрал Яндекс-переводчик.
Решил попробовать на основе легендарной речи  "I have a dream", с каждым абзацем все лучше и лучше:)
digitalbro,
спасибо большое! 
замечательно
Letterbox
Елизавета Фастенко
19 сентября 2017, 14:06
Спасибо огромное за улучшение

Классно
Александр Алимов
20 сентября 2017, 10:35
Пока так....
Наше старе село
20 сентября 2017, 20:10
Молодцы! Жду нейрон и для китайского языка
Яндекс, куда с 14 сентября делся сайт и подсайты на домене *.shell.yandex.net?
Новости, погода - ничего больше не работает на мобильном!
Яндекс браузером стал пользоваться только из-за переводчика. Переводом с английского пользуюсь ежедневно. Существенный плюс его - возможность прослушать словосочетания (правда часто из-за скороговорки не удаётся расслышать с первого раза). Очень хорошее подспорье в освоении английского. Большое спасибо!
мипткуащшпиркушаприо
25 сентября 2017, 10:02
yyooz,
Yandex переводчик можно  включить и в Firefox, с помощью  программных кодовых  настроек  в about:config.
Что-ж. Молодцы, разработчики, что и дальше развиваетесь со своими проектами! Google уже давно забросил все свои сервисы. Сейчас он что и делает, что выпускает типичные обновления, вроде "исправились ошибки" и так далее. Но не Яндекс! Рад, что вы до последних пор занимаетесь своими проектами и не забрасываете их. Спасибо вам!
Денис,
я с тобой согласен!
Денис,
 Да, да! Яндекс лучше Гугля.
Благая весть. Спасибо! Молодцы! Держите марку.  Успехов вам на этом поприще.  
Когда ожидать  перевод с французского?
Костя Долгих
24 сентября 2017, 23:40
Это лучшая реклама CatBoost, которую я наблюдал! Обязательно воспользуюсь им, если попадётся подходящая задача. По поводу перевода: модель языка очень хорошо правит перевод, текст становится читаем. Если добавите такую вещь в перевод с русского языка, то будете большими молодцами.
мипткуащшпиркушаприо
25 сентября 2017, 09:55
Никакой разницы не заметил, текст всё равно надо так или иначе редактировать, чтобы он соответствовал как по смыслу, так и по значению к оригиналу.

Не хватает подсветки переводимой фразы или слова, выделил в одном окне -> автоматически выделился перевод.
Дарья Шумилова
25 сентября 2017, 14:46
Eeeeeee
Никита Громаковский
25 сентября 2017, 17:12
Есть вопрос, можно ли сделать новую технологию перевода прямо на страницах? А то бегать во вкладку с переводчиком, а потом обратно на страницу, посмотреть картинку не очень удобно.
Самая простейшая проверка для любого электронного переводчика - это предложить ему какой-нибудь несложный текст перевести с одного языка на другой и обратно. Если получившееся имеет тот-же смысл, что и оригинал, тогда система перевода работает более-менее. Если текст уродуется до полного изменения смысла - значит система перевода сильно ошибается.
Даже странно, что создатели всех этих переводчиков до сих пор не используют настолько простую проверку качества перевода. Её же можно использовать не только для проверки, а для самообучения системы перевода.
landgraf.andrew,
  Ха-ха, я постоянно так и проверяю полученные переводы, чтобы добиться приемлемого!
Пользователь П.
27 сентября 2017, 15:41
класс
говно

pupknikt.vasya2018,
сам ты говно, Васька!
Постоянно пользуюсь переводом с испанского и обратно, раньше установишь исп, и не меняется при открытии яндекса а сейчас все время стоит англ, и приходится надрываться менять язык
просто отлично!!! Спасибо яндекс
Александра
2 октября 2017, 00:52
Я поздравляю вас! Вы делаете что-то невероятное. Спасибо вам огромное за проделанную работу. Хоть и моя функция "переводчика" совсем скоро станет неактуальна...мне все равно нравится смотреть как гибридная система переводит иногда лучше меня и... других, соответственно.  :))))
Александра,
  Неактуальна?! ...
Удалённый пользователь
16 октября 2017, 00:59
Александр,
если не понял в предыдущем овете тебя спросили не актуальна а как же ты на результат который тебе нравится смотреть будеш смотреть не нажимая на эту функцыю
Обновлено 16 октября 2017, 01:00
Не позорьтесь:
"blind date"
"Manners Maketh Man"
А в приложение под Android эта функция, а также улучшение произношения и распознавания английских слов когда планируется?
avmaksimov,
Неизвестность
ваша программа полезна спосибо большое 
makushin.egor1,
спасибо через а))
Когда услышал про "морников", смеялись долго всей семьёй))   Перевод отличный ;)
наберите aeiou и звук врубите)))
sia205,
 Я не разобрал, если бы помедленнее озвучивала дама...
nick@feldenkrais.pro
6 октября 2017, 20:05
Здорово что нейронные сети в полной мере пришли и в Яндекс Переводчик. Подскажите когда доступ к новой версии появится черезе API?
Вот если можно было бы выделить плохой перевод и нажать палец плохой перевод, тогда наверно быстрее бы обучение пошло. Или так и есть?
Спасибо большое.
 satis VEL
Удалённый пользователь
10 октября 2017, 20:34
Моё слово, блин, простое: полная хрень. Мой браузер Mozilla. Установил в нём,  с помощью  https://element.yandex.ru , Яндекс-переводчик наведением мышки на слово. Пару недель всё было нормально, наводил мышку на английское слово-получал перевод. А теперь что ? НИ ХРЕНА. Попробуйте сами установить/восстановить сейчас Яндекс-переводчик, с помощью того же самого https://element.yandex.ru     Так что какой там, на х*й, нейро-переводчик, у Вас ребята, с самым элементарным переводом ни *уя, sorry, не получается.
Я уже оценил.
Сразу же, как только в переводчике появилась кнопка, попробовал на разных фразах.
Оставил кнопочку включённой, и вскоре отметил явное улучшение: конструкции предложений в переведённом тексте стали грамотнее. Про смысл, его изменение, или даже потерю, пока не сужу.  Попозже.
Ещё до нейро-перевода в Яндексе общался с колумбийцем на испанском. Пробовал Яндекс и Google переводчик. Так вот иностранец очень удивился, когда для общения я стал использовать Яндекс переводчик, говорит стал ещё лучше меня понимать, нежели с Google переводчиком!
Егор-Дудин Егор-Дудин
15 октября 2017, 19:17
мне кажется, разработчики Яндекса трудятся без перерыва!Ведь этот переводчик знает и умеет больше,чем сам коренной англичанин!Вы- лучшие!
Такая хуета эта система, пиздец нажимаю на эту "Новую технологию" Он мне из текста 3 предложения убирает. Система пока сырая, не советую пользоваться в данное время.
спрсибо чтобы зделоли это самое к
Electrical connector4
мой любимый переводчик - wordus. Но в последнее время больше пользую яндекс-переводчиком или комбинирую их. Спасибо за помощь. Насчет французского, итальянского и немецкого: можно пошаманить, так что  получиться не хуже, чем с английского.
Работаю  с техническими переводами. Иногда пользуюсь двумя переводчиками, затем выбираю лучший вариант. В 95% случаев Яндекс нормально справляется с переводом. Заметил особенность: Яндекс лучше  работает с техническим текстом, в частности с металлографией. Гугл, на мой взгляд, лучше переводит экономику и компьютерную терминологию. Разработчикам респект.
kryto syper

Иногда перевод получается забавным. Поэтому я делаю обратный перевод: фразу, переведенную на английский перевожу еще раз на русский, чтобы понять, как будет правильно. За данную статью спасибо!
tamara.sheybak,
 Ага, и получается абракадабра...
Александр,
Да, Вы правы. Я выделяю отдельные слова и из выпадающего списка синонимов выбираю наиболее подходящий по смыс лу. Но не уверена, что получается идеальный перевод. Работаю с учебниками,т.к. вживую не с кем практиковаться. Ведь именно в диалоге совершенствуется владение языком.
tamara.sheybak,
  Идеальным перевод всё-равно не будет, не получится.
Но похлопотать, чтобы сохранился тот же смысл стоит.☺
Обновлено 24 октября 2017, 10:55
Хочу спросить знатоков про переводчик Бинг  (от Микрософта) - как он им.
Я попробовал его однажды. Он перевёл (удобоваримо) малопонятный разговорный текст с турецкого. А Яндекс и Гугл упорно выдавали кашу... После этого он меня и заинтересовал.
Поэтому спрашиваю, кто пользовался. Другим тоже будет интересно. ☺
Думаю, нужно дать времени быть. Ведь ранее было на много хуже с Вирт. -  переводчиками. Если бы её, нейро сеть, ещё и ударениям научить (!) вот это было бы совсем здорово. Но пока Я. впереди планеты всей )))))). Мерси и пфенкью  команде Я.   
zerian,
HJBGJYHGBI\
OSazonova2007,
 что это ??? hjbgjhgbi ?
Постоянно пользуюсь Я.переводчиком, спасибо за улучшения.очень удобно
Поражаюсь, как хорошо он работает для большинства текстов, в больше половины случаев даже исправлять не надо; рука так и тянется к зелёной кнопочке.  Очень нравится и возможность исправить перевод прямо на месте; вдруг кому поможет :)
Dmig13,
 
А вдруг - ошибочный перевод присоветуете глупой машине?
И будет потом тиражироваться эта  ваша ошибка.
Александр,

Честно говоря, сомневаюсь: и в том, что носитель русского языка не сможет правильно перестроить предложение, чтобы оно было лучше; и в том, что "глупая машина" будет выдавать именно мой пример для каждого такого предложения. Всё-таки эта машина - нейронная сеть, которая, скорее всего, мой пример просто прогонит пару раз и кинет куда-нибудь в архив.
Dmig13,
  Я имел в виду изменение смысла в переводе.
А конструкцию-то - да, улучшить можно.
Commonwealth (Содружество) в Fallout 4 переводит как.. РЕЧЬ ПОСПОЛИТАЯ.
Срочно нужен мод на Речь Посполитую в игру, дабы скакать на коне в Яндекс.
Обновлено 27 октября 2017, 09:58
КРУТО! Вы добавили 'мозги в банке'! То есть я имел в виду нейронную сеть ;'-) ! Не плохо звучит шутка про обзывание нейронной сети 'мозгами в банке'. Но скорее можно сказать 'мозги в модуле'или короче 'мозги в микросхеме/микрочипе/нейропроцессоре'. Короче круто!
Яна Осипова
2 ноября 2017, 22:57
клас
Я стараюсь писать короткими фразами,так как длинные тексты переводятся очень неточно и смысла сказанного не передают или передают очень приблизительно.Слова в тексте,который необходимо машине перевести,надо подбирать очень тщательно.Должен быть создан алгоритм,позволяющий машине анализировать тексты и быстро вносить коррективы в свою работу.А пока переводы очень корявые и неточные.
Александр
5 ноября 2017, 23:50
Таня,
 "Писать короткими фразами"...  Выход такой. Писать предложениями, как в букваре.  Тогда сохранится смысл... 
Я английского совсем не знаю. И мне очень интересно, что там читает не очень образованная американка из самой глубинки, штат Вашингтон. А иногда я таки позволяю себе писать текст посложнее "букварьского", если настроение художественное. Но тогда я посылаю 3! превода: Яндекса, Гугла и Бинга (ещё и ФБуковский есть, но - точно, - дрянь). Эти переводы русского текста - всегда разные!
Короче, ну, не получится писать всегда "короткими фразами"... ☻
непонятно.Почемуникак не переводится на русский
Саша такмаков
7 ноября 2017, 18:49
Здравствуйте. У меня вопрос такой а эта технология только для английского языка работает?
Саша такмаков
7 ноября 2017, 19:14
Саша такмаков,
Или она поддерживает все языки?
maxendra310.kostromin
7 ноября 2017, 19:07
sdcard is mounted
lutinleha,
ага мега крууууууууууууууууууууууууууууто
 я постоянно пользуюсь переводчиком очень удобно даже если в метро срочно надо что не будь перевести можно на телефоне с фотографировать и всё не известный текст на не известном языке переведён и не надо по пол часа печатать на телефоне. Мне очень нравится переводчик яндекс не то что гугл и осень круто
Обновлено 7 ноября 2017, 19:52
Александр
8 ноября 2017, 04:05
Нынче народ пошёл безграмотный, правил своего родного русского языка не соблюдает на письме, вроде вышеотписавшегося. И таковых очень много. Как же гибридная система переведёт текст с орфографическими ошибками с русского на английский? Будет ли смысл?
То же можно спросить и об обратном переводе. В штатах в глубинке, я смотрю, тоже полно "грамотеев" (сужу по перепискам в ФБ). И гибрид (в итоге) выдаёт абракадабру!
Александр,
невозможно объять необъятное. Нет пределов человеческой глупости. В смысле, на каждую нейросеть найдётся свой условный безграмотный "вася" или "билл".
Время от времени пользуюсь яндекс - переводчиком (english). Буду краток. Он мне очень нравится. Работоспособность намного лучше, чем у других переводчиков. Палец верх!
Обновлено 8 ноября 2017, 11:46
merivanakilbekovna
8 ноября 2017, 18:41
forgive me
slavik.ignatenko2017
10 ноября 2017, 14:22
хочу понять как его установить
Большое спасибо!

Переводчиком пользуюсь. Английский знаю, забываю )))
Иногда бывают моменты, все слова в предложении знаю, -
но смысл не понял!!! - Выручает.
Другие языки тоже помогает общий смысл понимать. Тоже хорошо.
Но я не об этом )))
Про нейронные сети - говорят могут всё, но всё зависит от того знает ли ответ,
тот, кто обучает нейросеть.
Я к тому
Возможно ли обучить нейросеть языку дельфинов?
Коммерчески это никому нафиг не нужно, но если ты не знаешь ответа,
возможно ли попросить кого-либо, научиться чужому языку.
Ещё раз - это не в тему, но в итоге
Можно ли нейросеть научить тому, чего сам не знаешь
Большое спасибо!
Luca38,
Нет. Ну, или точнее, почти. Нейронная сеть может найти ранее не замеченные закономерности между информацией или решить проблему классификации. Она может понять что, например, в "языке дельфинов" один конкретный звук часто следует после второго конкретного звука. Даже сможет сказать что-нибудь адекватное на этом языке. Но не сможет перевести, как раз из-за отсутствия других данных. Нету информации, что конкретно одна последовательность на "дельфинском" "равна" другой на русском; что как раз присутсвует в Яндекс Переводчике.С помощью нейронных сетей можно найти то, что скрыто в объёме информации, как ,например,  при игре в Го; но если человек сам не знал бы как играть, то и модель игры выстроить не возможно.
<blockquote class="twitter-tweet" data-lang="en"><p lang="ru" dir="ltr">Хочу почаще такие вечера как вчера</p>&mdash; Δārия (@sdsergeevnaa) <a href="https://twitter.com/sdsergeevnaa/status/929567676334268416?ref_src=twsrc%5Etfw">November 12, 2017</a></blockquote>
<script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script>
Вероника Иванова
12 ноября 2017, 20:49
Обожаю этот переводчик))... Спасибо за улучшения)
Владислав Егоров
13 ноября 2017, 21:48
eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeбой
lutsknko.daniil2017
15 ноября 2017, 15:03
гусь

Спасибо конечно за такое исправление но у меня как было так и есть. Исправляет только ингода

если ты проиграл себе значит ты проиграл всем 
Владислав
17 ноября 2017, 12:46
Внедрите эту систему перевода в Я.Браузер и сделайте пожалуйста возможность перевода PDF файлов в браузере, надоело оттуда текст постоянно копировать в Я.Переводчик!
cock orin и smal lof
Добрый день!
Возможно ли в ваш переводчик добавить синтаксический разбор предложения текста оригинала? Скажем, иногда хотелось бы выделить имя подлежащее, имя сказуемое, или дополнения. Например, нельзя перевести предложение „Жизнь победила смерть“, пока не указано, что здесь является именем подлежащим.
Синтаксический разбор предложения — одна из самых тяжелоформализуемых задач.
Если в помощь автоматическому переводу добавить помощь человека, то можно значительно улучшить качество перевода. Это будет и хорошей тренировкой искусственной нейронной сети (в том случае, если она настроена делать такой синтаксический разбор предложения).
Еще хорошо было бы ввести такую удобную в математике вещь, как скобки.
Например, если во фразе  „trivial chain condition“ слово „trivial“ относится к слову „chain“, то это можно было бы изобразить как „(trivial chain) condition“, а если — к слову „condition“, то — „trivial (chain condition)“. 
Можно было бы много написать, как лучше сделать интерфейс для синтаксического разбора предложения, но это в том случае, если вас заинтересует такая возможность: к полностью автоматическому переведу добавить возможность полуавтоматического перевода, которая бы не только улучшила качество перевода, но и позволила бы натренировать нейронную сеть. 
Мария Палагина
18 ноября 2017, 18:55
Как победить морников: Яндекс запустил гибридную систему перевода. здесь ошибка с переводом!!! Надо не хорошие морники, а с добрым утром дети

Перевод в целом стал качественнее, только зачем словами переводятся и цифры?! Например, 623 в англ. тексте было переведено тоже - "шестьсот двадцать три". Можно этого как-то избежать?

парк в я моя поездка на велосипеде по воскресеньям
мне ставят 5 4 4 5 4 5 5 4
vovanov.vovan13pposad
29 ноября 2017, 01:27
поживём-увидим
Коля Наумов
2 июля 2018, 23:21
его нужно скачать?

я часто пользуюсь переводчиком яндекс, создаю субтитры с оригинальных титров. И единственная проблема, которая замедляет работу это то, что переводчик зачем-то прописывает нумерацию титров словами.  Может кто-нибудь решить эту задачу? Она правда разительно замедляет работу. В отличие от постоянного копирования одного предложения или реплики, можно было бы сразу копировать 10 000 символов и вставлять в текст, однако с прописанной нумерацией возникает тотальная проблема.
В чувашском языке он не может перевести даже самые простые слова как Кочевник - Куçавçă, или например Пăши - Лось, и много другого
Света Чистякова
Сотрудник Яндекса3 февраля 2020, 19:55
Здравствуйте. Чувашский только-только появился — скоро будет отдельный рассказ, как мы его добавляли. Мы продолжаем улучшать переводы, скоро должно стать лучше. Если видите ошибки, сообщайте, пожалуйста, о них нам, всё поправим. Можно, например, через эту форму. Спасибо!
anna.iankovskaia
7 мая 2020, 22:42
Здравствуйте! Доступен ли рычаг переключения между статистическим и нейро переводом в актуальной версии для направления английский-русский? Не смогла его найти в веб-версии. Спасибо :)