Очень нужны головы и руки для аналитики вокруг распознавания и генерации речи.
- Как посчитать расстояние между парой текстов?
- Как замерить качество распознавания речи и последующего разбиения на реплики в закадровом переводе видео?
- Как найти в логах распознавания сложные примеры, которые помогут обучить более точную модель?
- Как проверить, что мы научились разделять голоса взрослых и детей?
- Можно ли по голосу различить сестёр?
- Как понять, нравится ли пользователям новый голос Алисы?
- Почему у голосовых ассистентов есть активационная фраза? Можно ли без неё?
- Как сравнить синтез речи разных голосовых ассистентов?
- Как собрать хорошие данные для генерации хохота, хрюканья, кваканья?
Столько вопросов!