Я пытаюсь построить механизм сравнения соответствия подобия с элементами mahout. Набор данных, как в следующем формате (атрибуты в тексте не в формате цифры)Создание модели данных для mahout
name : category : cost : ingredients
x : xx1 : 15 : xxx1, xxx2, xxx3
y : yy1 : 14 : yyy1, yyy2, yyy3
z : xx1 : 12 : xxx1, xxy1
Так-для того, чтобы использовать этот набор данных для погонщик в поезд, что это правильный способ преобразовать это, чтобы (как CSV Boolean data set), принятый mahout.