Перейти к основному содержимому

Создание датасета

Чем лучше бот понимает пользователей, тем лучше он будет справляться со своими задачами. Поэтому важно обучить его на наборе данных, похожих на те, с которыми бот столкнется при реальном общении.

JAICP предоставляет инструменты, с помощью которых вы можете создать датасет для обучения бота из интерфейса платформы:

предупреждение
По умолчанию разметка логов и дообучение интентов отключены. Отправьте запрос технической поддержке, если хотите, чтобы эти инструменты стали для вас доступны.

Чтобы перейти к созданию датасета:

  1. Перейдите в проект и на панели управления нажмите CAILA → Разметка логов.

  2. Выберите подходящий для вас инструмент — разметку логов или дообучение интентов.

    подсказка
    Используйте разметку логов, если у вас есть собственные данные для обучения. Дообучение интентов будет полезно, когда бот уже какое-то время проработал и накопил данные о диалогах.
  3. В зависимости от того, что вы выбрали, загрузите файл с данными или нажмите Импортировать из аналитики. Теперь вы можете приступать к работе над датасетом.

    подсказка
    В статье Как обучать интенты собраны практические рекомендации по наполнению классификаторов CAILA. Учитывайте их при работе над датасетом.

Если вы уже пользовались разметкой логов или дообучением в этом проекте, но теперь хотите обработать новый датасет, после перехода в CAILA → Разметка логов нажмите Новый набор фраз.