Я хочу создать набор данных ARFF для WEKA и использовать классификатор Nearest Neighbors
. Мои данные - это 2D-точки с координатами X
и Y
, и я буду использовать евклидово расстояние, чтобы найти соседей.Как создать файл ARFF для двумерных точек данных?
Это правильный формат?
@RELATION name
@ATTRIBUTE X NUMERIC
@ATTRIBUTE Y NUMERIC
@ATTRIBUTE class {classy,classless}
@DATA
0,4,classy
0,6,classy
1,3,classless
Благодаря
Мне было интересно, работает ли Euclidean distance в этом формате или нет? –
Euclidean distance работает с этим форматом. Однако вы можете использовать * consony сходство * вместо этого, в случае, если для вас точки (1,2) и (100,200) следует считать очень похожими или близкими из-за пропорций. Алгоритмы Nearest Neighbors от WEKA разнообразны. Вы можете найти их под 'weka.classifiers.lazy'. Наиболее типичный, IBk, не использует евклидово расстояние, если, как указано в документе, оно следует классической работе Aha * et al. *. Другие не используют Евклидово расстояние (согласно документу). –