Блог о технологиях Яндекса

Новые языковые модели в SpeechKit Mobile SDK

Пост в архиве.

Библиотека SpeechKit Mobile SDK обновилась. Первое, на что хочется обратить в этом обновлении - это новые языковые модели для распознавания речи:

  • модели для распознавания дат, чисел и имён при голосовом вводе;
  • модель для подтверждения заказов и доставки;
  • модель, оптимизированная для распознавания имён исполнителей и названий песен.

Первая модель уже находит применение в абсолютно разных областях обработки речи, а вот две остальные специально делались специализированными. Модель подтверждения заказов и доставки разрабатывалась специально идя интернет-магазинов, стремящихся оптимизировать способы оповещения, например, об оформлении заказа. А вот распознавание исполнителей и песен особенно актуально будет для музыкальных сервисов, к которым могут приходить с запросами типа [алла пугачёва миллион алых роз]. Теперь пользователям таких сервисом будет намного проще найти заинтересовавшее их произведение.

Сам голос, общающийся с пользователями, не менее важен. Поэтому теперь появилась возможность выбрать, каким голосом ваше приложение будет разговаривать с пользователями. Уже доступно пять вариантов — три женских голоса и два мужских.

Кроме того, в этом обновлении мы поддержали не только русский, но также украинский, английский и турецкий языки для диктовки коротких текстов, а также поиска адресов и организаций.

Подробности о всех возможностях вы найдёте на странице библиотеки.

Описанные выше возможности относятся к бесплатной версии SpeechKit Mobile SDK. Но если в списке моделей для распознавания нет той, что подходит для ваших задач, например, если вы хотите создать свой голос или планируете реализовать голосовой интерфейс в офлайн-режиме, вы можете воспользоваться бизнес-версией нашего сервиса.

Команда SpeechKit