Дообучение интентов
В процессе работы бота JAICP постоянно накапливает данные о диалогах: какие фразы отправили пользователи, как бот их распознал и какие действия совершил в ответ.
CAILA может помочь вам использовать эти данные, чтобы дообучить бота — пополнить интенты тренировочными фразами из уже состоявшихся диалогов. Так вы можете быстро отследить, какие фразы не распознал бот, и добавить их в обучающую выборку, чтобы в дальнейшем таких ошибок уже не было.
Вы можете дообучить бота:
- Через инструмент разметки логов. Он поможет обработать фразы, чтобы вам было проще с ними работать.
- Вручную через аналитику по диалогам.
Через разметку логов
Чтобы начать дообучение с помощью разметки логов:
- Перейдите в проект и на панели управления нажмите CAILA → Разметка логов.
- Если ранее вы уже пользовались разметкой логов, нажмите Новый набор фраз.
- Нажмите Импортировать из аналитики.
Импортируются только последние 500 фраз. При этом из них удаляются дубликаты и фразы, которые уже есть в интентах, а также фразы короче 3 и длиннее 80 знаков. После импорта фразы разделятся на две группы:
Распознанные — фразы, которые классификатор успешно отнес к одному из интентов.
подсказкаПолезно просматривать фразы, распознанные с низким весом, — среди них вы можете найти ложные срабатывания. Добавляйте такие фразы в другие, более подходящие интенты. Вы также можете увеличить пороговые значения классификатора, чтобы фразы с низким весом распознавались реже.Нераспознанные — фразы, не отнесенные ни к какому интенту.
Далее вы можете работать с фразами через стандартный интерфейс разметки логов: разметить их с помощью различных алгоритмов, выделить группы похожих фраз, добавить в существующие интенты или создать новые.
Вручную
При просмотре аналитики по диалогам вы можете поодиночке добавлять фразы пользователей в интенты.
Перейдите в проект и на панели управления выберите Аналитика → Диалоги.
При необходимости настройте способ отображения результатов:
- Сессии (по умолчанию) — если вы хотите целиком просматривать сессии взаимодействия с ботом.
- Фразы — если для вас достаточно отдельных фраз без учета их контекста.
Настройте нужные фильтры, чтобы сузить выборку.
подсказкаНапример, чтобы оставить только фразы, не распознанные в сценарии, примените фильтр Класс сообщения по событиюnoMatch
.Если вы просматриваете сессии, выберите одну из сессий, чтобы перейти к ее фразам.
Под строкой с нужной фразой нажмите Добавить фразу в интент. Появится окно выбора интента.
подсказкаТекст фразы доступен для редактирования. Вы можете исправить опечатки, изменить порядок слов или удалить слова, не относящиеся к интенту.Выберите подходящий интент и повторно нажмите Добавить фразу в интент.