В настоящее время я работаю над проектами, в которых я должен классифицировать данные обзора ресторана. Я использую многокомпонентный алгоритм Наивного Байеса. Я немного смущен, что моя проблема связана с многокласными или многоколоночными.Multiclass vs Multilabel
обзор ПРИМЕР-
Пожалуйста, относиться к своему клиенту, как клиент, а не собаки. . Я никогда не пойду или не советую никому пойти в Найейям, Хауз Хас. Они ребята, больные и полные бизнесмены. Пища была версия плохой вкус, но место и сотрудники были слишком грязные
Он содержит три различных класса, как
Bad Experience
Staff Behavior
food quality
Как создать набор данных для обучения?
Должен ли я использовать MultiLabel и создавать обучающие данные, установленные как
ID Content Tags
1, "content of the review#1", Bad Experience,Staff Behavior,food quality
или
как в мультиклассируют
Review Tags
above review, Bad Experience
above review, Staff Behavior
above review, food quality
Любое предложение
Я считаю, что хорошим подходом будет мультипликация на основе 'x'.То есть для каждого обзора 'x' есть метки' y', где 'y' - вектор с элементами' n' ('n' - количество меток). Значения 'y' являются нулями и единицами (один для правильных меток для каждого образца). – sirfz