2016-06-13 3 views
1

У меня есть много существующих данных, которые я хотел бы использовать в качестве учебных данных для wit.ai chatbot. Данные хранятся в файле csv, где каждая строка имеет оператор/вопрос и ответ на этот запрос/вопрос.Как использовать wit.ai с существующими рядами данных?

Я знаю, что wit.ai требует, чтобы вы назначили намерения для комментариев, и поэтому мне интересно, есть ли способ просто отправить данные, которые у меня есть, и попросить чатбот начать обучение намерениям самостоятельно.

Спасибо!

ответ

1

«Обучение» Wit.Ai не совсем то, что некоторые могут подумать.

Вам нужно будет создать истории для вашей колонки User says. Ответы не имеют значения, если честно. Вы не можете «научить» wit.ai ответить. Ответы определяются в истории или в вашем коде.

Что может понадобиться wit.ai из ваших данных - это ключевые слова и ключевые фразы, которые делают распознавание сущности лучше для wit.ai.

Вот простейший пример:

enter image description here

Entity color признается на основе ключевых слов, перечисленных. Поэтому, если у вас много данных в качестве примера ввода пользователя, вы можете сначала попытаться разбить его на «какие объекты, которые должны вводить пользовательские данные», а затем ключевые слова из этих данных.

Использование ваших данных для «обучения» - было бы немного сложно, так как это потребует от вас создания большого количества Историй в wit.ai для покрытия возможных пользовательских ввода и идентификации объекта. Но вы все равно можете сделать это следующим образом:

(грубый пример)

  1. сделать одну историю о пользователе, задающего время, например
  2. Отметка на входе пользователя, какие объекты должны быть выведены из этого входа: enter image description here
  3. Сортируйте список вы должны получить все возможные пути просить время:
    • Как поздно это?
    • Можете ли вы рассказать мне время?
    • Интересно, какое сейчас время?
  4. Используйте сценарий (Python), чтобы «снимать» все эти пользовательские входы в своей истории.
  5. После выполнения - перейдите к разделу «Понимание времени wit.ai» и пройдите через все исправления ввода/добавление сущностей, которые вы определили.

Этот процесс будет «обучать» сущности, если они основаны на ключевых словах или какой-либо другой алгоритм.

Это лучшее, что я могу придумать о том, как использовать существующие данные. Wit.Ai отличается от других инструментов обработки языка и «обучает» его существующим данным, несколько «озадачивает» :)

+0

Спасибо за подробный ответ! Это действительно отстой. Я думал, что мой набор данных можно использовать с чем-то вроде остроумия. Может быть, я посмотрю на использование реализации neur network chatbot с открытым исходным кодом. – user402516

2

Спасибо за сообщение.Мы знаем, что это еще не идеально, но мы выпустили функцию импорта/экспорта несколько дней назад. Рассматривая структуру экспорта json, можно, вероятно, легко загружать существующие данные. Это потребует создания одной истории для каждого заявления/вопроса и ответа. Дополнительная информация здесь: https://wit.ai/docs/recipes#copyexportversion-my-app

+0

hmm..thanks so much! но даже тогда нет возможности легко оценить сущности и намерения правильно? – user402516

+0

@ l5t - Это хорошо! Есть ли ограничение на размер файла? У меня есть огромный набор выражений с настройками, которые я хотел бы подать. –