Перейти к основному содержимому

Дообучение интентов

В процессе работы бота JAICP постоянно накапливает данные о диалогах: какие фразы отправили пользователи, как бот их распознал и какие действия совершил в ответ.

CAILA может помочь вам использовать эти данные, чтобы дообучить бота — пополнить интенты тренировочными фразами из уже состоявшихся диалогов. Так вы можете быстро отследить, какие фразы не распознал бот, и добавить их в обучающую выборку, чтобы в дальнейшем таких ошибок уже не было.

Вы можете дообучить бота:

  • Через инструмент разметки логов. Он поможет обработать фразы, чтобы вам было проще с ними работать.
  • Вручную через аналитику по диалогам.
подсказка
В статье Как обучать интенты собраны практические рекомендации по наполнению классификаторов CAILA. Рекомендуется учитывать их при дообучении.

Через разметку логов

предупреждение
По умолчанию разметка логов отключена. Отправьте запрос технической поддержке, если хотите, чтобы разметка логов стала для вас доступна.

Чтобы начать дообучение с помощью разметки логов:

  1. Перейдите в проект и на панели управления нажмите CAILA → Разметка логов.
  2. Если ранее вы уже пользовались разметкой логов, нажмите Новый набор фраз.
  3. Нажмите Импортировать из аналитики.

Импортируются только последние 500 фраз. При этом из них удаляются дубликаты и фразы, которые уже есть в интентах, а также фразы короче 3 и длиннее 80 знаков. После импорта фразы разделятся на две группы:

  • Распознанные — фразы, которые классификатор успешно отнес к одному из интентов.

    подсказка
    Полезно просматривать фразы, распознанные с низким весом, — среди них вы можете найти ложные срабатывания. Добавляйте такие фразы в другие, более подходящие интенты. Вы также можете увеличить пороговые значения классификатора, чтобы фразы с низким весом распознавались реже.
  • Нераспознанные — фразы, не отнесенные ни к какому интенту.

Далее вы можете работать с фразами через стандартный интерфейс разметки логов: разметить их с помощью различных алгоритмов, выделить группы похожих фраз, добавить в существующие интенты или создать новые.

Вручную

При просмотре аналитики по диалогам вы можете поодиночке добавлять фразы пользователей в интенты.

  1. Перейдите в проект и на панели управления выберите Аналитика → Диалоги.

  2. При необходимости настройте способ отображения результатов:

    • Сессии (по умолчанию) — если вы хотите целиком просматривать сессии взаимодействия с ботом.
    • Фразы — если для вас достаточно отдельных фраз без учета их контекста.
  3. Настройте нужные фильтры, чтобы сузить выборку.

    подсказка
    Например, чтобы оставить только фразы, не распознанные в сценарии, примените фильтр Класс сообщения по событию noMatch.
  4. Если вы просматриваете сессии, выберите одну из сессий, чтобы перейти к ее фразам.

  5. Под строкой с нужной фразой нажмите Добавить фразу в интент. Появится окно выбора интента.

    Добавление фразы пользователя в качестве тренировочной фразы интента

    подсказка
    Текст фразы доступен для редактирования. Вы можете исправить опечатки, изменить порядок слов или удалить слова, не относящиеся к интенту.
  6. Выберите подходящий интент и повторно нажмите Добавить фразу в интент.