Настройка генерации речи

Чтобы речь навыка звучала более естественно, оформите текст с применением TTS-разметки. Разметка размещается в свойстве response.tts:

{
  "response": {
    "text": "Добро пожаловать в Атлас.",
    "tts": "Добро пожаловать в +атлас.",
  }
}

Проверяйте разметку для голоса на тестовом стенде Speechkit. Так вы сразу услышите, как звучат изменения.

Отмечайте ударения

Если значение слова меняется в зависимости от ударения — добавляйте перед ударными гласными знак +. Например:

Разбейте сложные слова на части и проставьте ударения для каждой. Например:

Попробуйте написать слова так, как они слышатся:

Для дополнительной паузы используйте синтаксис sil <[ <количество_миллисекунд> ]>. Например, sil <[1000]> — это пауза длиной в 1 секунду.

{
  "response": {
    "text": "Смелость города берет.",
    "tts": "смелость sil <[500]> город+а берёт",
  }
}

Также паузу в 50–100 мс добавляет пробел между знаком препинания и следующим словом.

Задавайте произношение слов с помощью фонем и синтаксиса слово <[произношение_по_фонемам]>. Например:

Как использовать фонемы

Фонемы:

a aa b bb c ch d dd e ee f ff g gg h hh i ii j k kk l ll m mm n nn oo p pp r rr s sch schwa sh ss t tt u uu v vv y yy z zh zz pau

Использование:

aa, ee, ii, oo, uu — ударные гласные.
bb, dd, ff, gg, hh, kk, ll, mm, nn, pp, rr, ss, tt, vv, zz — мягкие согласные.
y — это «ы».
schwa — нейтральный гласный звук, в который могут превращаться безударные «а», «е», «и», «о», «ы».
pau — пауза при произнесении.

Разработка прототипа голосового приложения (с 6:02)

Как научить Алису петь?