«Обучение» Wit.Ai не совсем то, что некоторые могут подумать.
Вам нужно будет создать истории для вашей колонки User says
. Ответы не имеют значения, если честно. Вы не можете «научить» wit.ai ответить. Ответы определяются в истории или в вашем коде.
Что может понадобиться wit.ai из ваших данных - это ключевые слова и ключевые фразы, которые делают распознавание сущности лучше для wit.ai.
Вот простейший пример:
Entity color
признается на основе ключевых слов, перечисленных. Поэтому, если у вас много данных в качестве примера ввода пользователя, вы можете сначала попытаться разбить его на «какие объекты, которые должны вводить пользовательские данные», а затем ключевые слова из этих данных.
Использование ваших данных для «обучения» - было бы немного сложно, так как это потребует от вас создания большого количества Историй в wit.ai для покрытия возможных пользовательских ввода и идентификации объекта. Но вы все равно можете сделать это следующим образом:
(грубый пример)
- сделать одну историю о пользователе, задающего время, например
- Отметка на входе пользователя, какие объекты должны быть выведены из этого входа:
- Сортируйте список вы должны получить все возможные пути просить время:
- Как поздно это?
- Можете ли вы рассказать мне время?
- Интересно, какое сейчас время?
- Используйте сценарий (Python), чтобы «снимать» все эти пользовательские входы в своей истории.
- После выполнения - перейдите к разделу «Понимание времени wit.ai» и пройдите через все исправления ввода/добавление сущностей, которые вы определили.
Этот процесс будет «обучать» сущности, если они основаны на ключевых словах или какой-либо другой алгоритм.
Это лучшее, что я могу придумать о том, как использовать существующие данные. Wit.Ai отличается от других инструментов обработки языка и «обучает» его существующим данным, несколько «озадачивает» :)
Спасибо за подробный ответ! Это действительно отстой. Я думал, что мой набор данных можно использовать с чем-то вроде остроумия. Может быть, я посмотрю на использование реализации neur network chatbot с открытым исходным кодом. – user402516