Как настроить генерацию речи

Текст, который навык отправляет Алисе, можно оформить в формате TTS (text-to-speech), чтобы тоньше управлять звуками, которые воспроизводит навык. Кроме произносимого текста вы можете использовать звуки из библиотеки Алисы.

  1. Настройка голосового синтеза
  2. Эффекты генерации голоса

Настройка голосового синтеза

(разметку для голоса можно проверить на тестовом стенде Speechkit)

Советы по использованию TTS-разметки:

  • При необходимости ударные гласные в словах следует отмечать знаком «+», например:

    • остр+ота,
    • м+ука.
  • Длинные слова можно разбить на слова покороче и проставить ударения для каждого из этих коротких слов, например:

    • мн+ого пр+офильный,
    • с+еми пал+атинск.
  • Некоторые слова можно попробовать писать так, как они слышатся:

    • «ненастный»нен+асный;
    • «пожалуйста»пож+алуста.
  • Каждый отделенный пробелами пунктуационный знак преобразуется в фонему pau (пауза в 50-100 мс). Чтобы задать длительную паузу между словами, используйте синтаксис sil <[ <количество_миллисекунд> ]>. Например:

    • смелость sil <[ 500 ]> город+а берет.

Эффекты генерации голоса

Вы можете наложить некоторые эффекты на голос, которым Алиса произносит ответ навыка. Примеры эффектов и формат указания эффектов — в разделе Наложение эффектов на голос.