2013-10-08 3 views
2

Есть ли способ указать несколько меток для примера в формате данных Wowpal Wabbit?Несколько ярлыков в Vowpal Wabbit

Я попытался запятая, и она не жалуется, но я не уверен, если это то, что я ожидал ...

Так, например:

2,3 | f1:3 f3:23 
2 | f1:2 f3:34 

Первая строка представляет собой пример, который как в классе 2, так и в классе 3.

Я действительно обсуждаю vowpal mailing list, но я не уверен, что с тех пор произошло что-то.

Том

+0

Нам нужно больше деталей. Вы проводите какое-то многоклассовое сравнение? – Spaceghost

+0

Привет, Нет, задача проста. У меня есть что-то вроде 30 классов (это темы). В учебном материале (который состоит из документов) примеры могут принадлежать более чем одному классу (документы могут принадлежать более чем одной теме). Так что мне просто интересно, как я должен отражать это в файле поезда в формате VW. – Tom

ответ

2

Похоже, что вы должны использовать CSOAA, которая позволяет несколько ярлыков. Они должны быть натуральными числами и меньше или равны K, где K - количество классов. Как это:

1 2 3 class1 | f1:2 f2:3 
4 2 5 class2 | f3:7 f5:3 
2 3 class3 | f4:2 f2:2 

Для более подробно, смотрите документацию Vowpal Wabbit: https://github.com/JohnLangford/vowpal_wabbit/wiki/Cost-Sensitive-One-Against-All-%28csoaa%29-multi-class-example

+0

Отлично. Большое спасибо! – Tom

+0

Это решает мой оригинальный вопрос. Тем не менее, я действительно искал многоквартирный SVM (потому что я хочу сравнить подход SVM с чем-то еще, что у меня есть). Но в документации CSOAA говорится, что вы должны оставить функцию стоимости в одиночку (так что я думаю, что нет «шарнира» здесь). Любые мысли о том, что .. ?? – Tom

+0

Sklearn (библиотека Python) имеет многоуровневую SVM .. – Spaceghost

Смежные вопросы