2013-12-12 5 views
0

Я хочу создать набор данных ARFF для WEKA и использовать классификатор Nearest Neighbors. Мои данные - это 2D-точки с координатами X и Y, и я буду использовать евклидово расстояние, чтобы найти соседей.Как создать файл ARFF для двумерных точек данных?

Это правильный формат?

@RELATION name 

@ATTRIBUTE X  NUMERIC 
@ATTRIBUTE Y  NUMERIC 
@ATTRIBUTE class {classy,classless} 

@DATA 
0,4,classy 
0,6,classy 
1,3,classless 

Благодаря

ответ

3

Вы просто ищете да или нет ответа? Это правильный формат для файла ARFF с двумя числовыми атрибутами и двоичным классом. Эта ссылка содержит много деталей в формате ARFF http://www.cs.waikato.ac.nz/~ml/weka/arff.html.

+0

Мне было интересно, работает ли Euclidean distance в этом формате или нет? –

+2

Euclidean distance работает с этим форматом. Однако вы можете использовать * consony сходство * вместо этого, в случае, если для вас точки (1,2) и (100,200) следует считать очень похожими или близкими из-за пропорций. Алгоритмы Nearest Neighbors от WEKA разнообразны. Вы можете найти их под 'weka.classifiers.lazy'. Наиболее типичный, IBk, не использует евклидово расстояние, если, как указано в документе, оно следует классической работе Aha * et al. *. Другие не используют Евклидово расстояние (согласно документу). –

Смежные вопросы