Блог о технологиях Яндекса

YaC 2014: речевые технологии

30 октября 2014, 11:03
На конференции YaC 2014 Яндекс представил новые разработки в области речевых технологий: голосовую активацию, выделение смысловых единиц из текста и синтез речи. Все три функции доступны в виде библиотеки SpeechKit Mobile SDK и облачной платформы SpeechKit Cloud. Это позволит разработчикам существенно расширить возможности своих продуктов.


Представленные разработки дополняют технологию распознавания речи, созданную Яндексом в 2013 году. Она понимает запросы на русском и турецком языках. Сейчас её используют 500 мобильных приложений, а также сервисы и устройства 600 различных компаний. Качество распознавания зависит от тематики запроса: для географических названий оно составляет 95%, для коротких фраз – 88%, для текстов вроде заметок и смс – 82%. С расширением набора технологий устройства и программы научатся не только распознавать речь, но и понимать, когда обращаются именно к ним, выполнять голосовые команды, а также озвучивать ответы.

Чтобы продемонстрировать новые возможности, Яндекс разработал специальное приложение-витрину Яндекс.Диктовка. Оно записывает под диктовку тексты на русском языке и умеет озвучивать написанное. Распознавание речи начинается по команде «Яндекс, записывай», отредактировать текст также можно с помощью команд. Формулировки могут быть любыми: приложение поймёт, например, и «Удали последнюю фразу», и «Сотри последнее предложение».

Скачать Яндекс.Диктовку для Android можно в Яндекс.Store. Версия для iOS появится в App Store чуть позже.