2012-05-22 2 views
1

Быстрая стартовая страница JavaDocs и mahout ужасна. Я получил копию Маху в книге действий. Я прочитал огромные полосы в книге Mahout in Action, в которой основное внимание уделяется форматированию данных только для систем Reccomender.Mahout: Как форматировать, загружать и работать с данными для классификации?

Как вы отформатируете файл, содержащий данные классификации?

Как загрузить его в DataModel mahout или есть ли другая модель данных для классификации? (Я видел что-то о векторах)

Как вы берете эту модель данных и включаете ее в свою классификационную систему?

ответ

0

(Saw вашего другой вопроса только сейчас.)

Я не думаю, что документы хороши в целом. Это становится лучше, когда такие люди, как вы, добавляют документы. Но Маху не является продуктом и даже не библиотекой. Это код для разработчиков и в значительной степени должен использоваться как код.

Большая часть классификации (из которой я мало знаю) использует Vector и поэтому использует VectorWritable в качестве формата проводов Hadoop для ввода.

DataModel не имеет отношения к классификаторам и нет аналогов. Это часть бит рекомендации.