2016-12-09 3 views
0

Из того, что я видел в документации и различных примерах, типичный worfklow с данными в Mallet, требует, чтобы вы работали с списком функций, который вы обычно получаете, передавая свои данные через " трубы ", итерации над ними каким-то итератором. Данные обычно хранятся в некотором csv-файле.Как использовать массив парных разрядов как вектор функций в Mallet

Я пытаюсь получить список функций из двух массивов двойников. Один массив хранит фактические функции и имеет размер n x m (где n - количество функций, а m - количество векторов признаков), а другой - размером 1 x м и содержит бинарные метки. Как мне преобразовать их в список функций, поэтому я могу использовать их в классификаторах.

+0

Показать нам код. По крайней мере, пример данных, которые у вас есть и чего вы хотите достичь. –

+0

Имея Double [] [], содержащие функции и Double [], содержащие метки для каждого вектор-функции, моя цель - получить объект класса InstanceList, который я могу использовать в обучении/классификации. Не нужно писать о том, как я получаю эти ценности - это не имеет большого значения. Вы даже можете представить два массива, заполненных значениями во время компиляции. – dkaras

ответ

0

Я закончил тем, что написал пользовательский Itereator, подобный тому, который присутствует в кефалье под названием «ArrayDataAndTargetIterator». Мне также пришлось использовать такую ​​трубу, как:

new SerialPipes(Arrays.asList(new Target2Label(), new Array2FeatureVector())); 
+0

Пользовательский итератор звучит как правильный путь. –

Смежные вопросы