Библиотека SpeechKit Mobile SDK обновилась. Первое, на что хочется обратить в этом обновлении - это новые языковые модели для распознавания речи:
- модели для распознавания дат, чисел и имён при голосовом вводе;
- модель для подтверждения заказов и доставки;
- модель, оптимизированная для распознавания имён исполнителей и названий песен.
Первая модель уже находит применение в абсолютно разных областях обработки речи, а вот две остальные специально делались специализированными. Модель подтверждения заказов и доставки разрабатывалась специально идя интернет-магазинов, стремящихся оптимизировать способы оповещения, например, об оформлении заказа. А вот распознавание исполнителей и песен особенно актуально будет для музыкальных сервисов, к которым могут приходить с запросами типа [алла пугачёва миллион алых роз]. Теперь пользователям таких сервисом будет намного проще найти заинтересовавшее их произведение.
Сам голос, общающийся с пользователями, не менее важен. Поэтому теперь появилась возможность выбрать, каким голосом ваше приложение будет разговаривать с пользователями. Уже доступно пять вариантов — три женских голоса и два мужских.
Кроме того, в этом обновлении мы поддержали не только русский, но также украинский, английский и турецкий языки для диктовки коротких текстов, а также поиска адресов и организаций.
Подробности о всех возможностях вы найдёте на странице библиотеки.
Описанные выше возможности относятся к бесплатной версии SpeechKit Mobile SDK. Но если в списке моделей для распознавания нет той, что подходит для ваших задач, например, если вы хотите создать свой голос или планируете реализовать голосовой интерфейс в офлайн-режиме, вы можете воспользоваться бизнес-версией нашего сервиса.
Команда SpeechKit