Мне трудно понять данные обучения в rasa nlu. Скажем, я хочу получить данные о тренировках, когда кто-то сообщает кому-то о животных, которых они могут купить. Для ясности воспользуюсь форматом уценки:
Допустим, пользователь гипотетически отвечает на вопрос:
«Какое животное вы хотели бы купить?»
Есть очень много разных способов сказать, что вы хотите что-то купить. Итак, возьмите пример ниже:
##intent:inform
- [cat](animal)
- buy [cat](animal)
- I would like to buy a [cat](animal)
Нужно ли мне повторять это для каждого вида животных, с которыми я собираюсь обращаться? Как ниже?
##intent:inform
- [cat](animal)
- [dog](animal)
- [parrot](animal)
- buy [cat](animal)
- buy [dog](animal)
- buy [parrot](animal)
- I would like to buy a [cat](animal)
- I would like to buy a [dog](animal)
- I would like to buy a [parrot](animal)
Кроме того, я заметил, что в ресторанном боте rasa они иногда повторяют один и тот же пример снова и снова, иногда до семи раз, как показано ниже:
##intent:inform
- [cat](animal)
- [cat](animal)
- [cat](animal)
- [cat](animal)
- [cat](animal)
- buy [cat](animal)
- I would like to buy a [cat](animal)
Зачем это нужно? Как это влияет на понимание? Как большее количество вхождений одного и того же слова в одной и той же позиции может быть индикатором того, что это правильный ответ, особенно если у вас есть что-то вроде приведенного ниже, где другое значение одного и того же объекта повторяется одинаковое количество раз?
##intent:inform
- [cat](animal)
- [cat](animal)
- [cat](animal)
- [cat](animal)
- [cat](animal)
- buy [cat](animal)
- I would like to buy a [cat](animal)
- [dog](animal)
- [dog](animal)
- [dog](animal)
- [dog](animal)
- [dog](animal)
- buy [dog](animal)
- I would like to buy a [dog](animal)
Спасибо, любые советы приветствуются.