Перейти к основному содержимому

Распознавание и синтез речи

В ботах, которые совершают и принимают звонки, используется распознавание и синтез речи:

  • Automatic Speech Recognition (ASR) или распознавание речи — процесс преобразования речи в текст.
  • Text-To-Speech (TTS) или синтез речи — процесс генерации речи по печатному тексту.

При создании телефонного канала вы можете:

  • Выбрать одного из провайдеров ASR/TTS, предоставляемых Just AI.
    В этом случае из интерфейса JAICP вы можете задать настройки синтеза и распознавания речи: например, выбрать модель распознавания, голос для синтеза и другие параметры.

  • Создать подключение с использованием собственного аккаунта одного из провайдеров ASR/TTS.

    подсказка
    Если для ASR/TTS вы используете собственное подключение, использование минут ASR/TTS Just AI для вас не тарифицируется.

Затем для формирования ответов из сценария вам нужно будет использовать тег a или метод $reactions.answer.

Разметка синтеза речи

Чтобы сделать речь бота более выразительной, вы можете использовать разметку синтеза речи. JAICP поддерживает специальный язык разметки синтеза речи (SSML), который позволяет настраивать тон, произношение, скорость, громкость речи и пр. Подробнее см. в разделе Разметка синтеза речи.

Синтез речи с переменными

Вы также можете использовать синтез речи с переменными, если хотите, чтобы бот озвучивал в диалоге переменные значения, зависящие от контекста. Подробнее см. в разделе Синтез речи с переменными.

Изменение настроек ASR и TTS из сценария

Настройки, которые вы задаете для провайдера распознавания и синтеза речи, распространяются на все звонки по телефонному каналу. Однако для каждого звонка вы можете переопределить их: например, прямо во время диалога изменить язык распознавания или голос, которым бот общается с пользователем.

Чтобы управлять настройками ASR и TTS из сценария, используйте новые методы встроенного сервиса $dialer:

МетодДействие
getAsrProvider
getTtsProvider
Получить имя провайдера ASR/TTS.
getAsrConfig
getTtsConfig
Получить текущие настройки ASR/TTS.
setAsrConfig
setTtsConfig
Переопределить настройки ASR/TTS.