У меня есть база данных, в которой хранятся данные на основе следующих трех полей: id, text, {labels}. Обратите внимание, что каждый текст присваивается нескольким меткам \ tag \ class. Я хочу создать модель (weka \ rapidminer \ mahout), которая сможет рекомендовать \ классифицировать кучу меток \ тегов \ классов для заданного текста.Классификация документов с несколькими ярлыками
Я слышал о SVM и Naive Bayes Classifier, но не уверен, поддерживают ли они классификацию с несколькими метками или нет. Все, что направляет меня в правильном направлении, более чем приветствуется!
Я думаю, что вы вводите в заблуждение многоклассовую и многокласную классификацию. В первом случае каждый образец имеет один класс, но есть более двух возможностей; в последнем случае каждый образец может принадлежать нескольким классам одновременно. –
Итак, давайте выбираем NB. Какими должны быть атрибуты в этом сценарии? У меня есть некоторые идеи по этому поводу, но я хотел бы услышать предложение кого-то с большим опытом, чем я. – user2295350
@larsmans Точно. То, что я прошу, - это классификация с несколькими метками, то есть каждый образец может принадлежать нескольким классам одновременно. – user2295350