2015-05-28 2 views
1

Я пытаюсь использовать SUBCLU в ELKI, но для того, чтобы понять, что я пробовал DBSCAN и даже KMEANSLloyd, просто я знаю, как вводить данные с высокой Габаритные размеры. К сожалению, я могу ввести только до 14 измерений, причем любой из них выше, и программа начинает жаловаться, что я не ввел параметр для «bubble.scaling», даже если у меня явно есть. Я ввожу данные с помощью. CSV-файла, отформатированного аналогично учебному файлу mouse.csv (вот как я выяснил, как вводить данные с размерами выше 1 в первую очередь). Что я делаю не так?Использование ELKI, имеющего проблемы с размерами выше 14

+0

Не имеет смысла, что он начинает жаловаться на параметр «bubble.scaling». Это указывает на то, что у него есть проблемы задолго до запуска алгоритма, возможно, даже до загрузки данных. На самом деле, похоже, что JVM каким-то образом перепуталась, так что у него есть проблемы с загрузчиком классов! Просьба предоставить stacktrace, а также попробовать стандартные методы * отладки *. –

ответ

1

Оказывается, я не форматировал файл CSV должным образом. Вместо того, чтобы иметь файл CSV только с данными в нем, разделенными пробелами для размерности, мне также нужно было включить заголовки. Поскольку я не использовал случайно генерированную информацию, и я не знал количество кластеров заранее, это выглядело как CSV.

## Size: 10 
######################################################## 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 
14 13 12 11 10 9 8 7 6 5 4 3 2 1 
14 13 12 11 10 9 8 7 6 5 4 3 2 1 
+0

Несмотря на то, что примеры данных высокого размера, которые они поставляют, не имеют этих заголовков, но волшебным образом работают очень хорошо. – Josh

+0

Небеса запрещают, чтобы мои данные работали так, хотя, никакие MY-данные не дают мне исключение java из-за границы. – Josh

+0

Я всегда использую файлы без заголовков, с более чем 14 размерами. Все мои файлы «волшебным образом прекрасно работают» ... уверен, что в вашем файле нет какой-то тонкой ошибки? Работает ли она из командной строки? Любая ошибка регистрируется? –

0

У меня была та же проблема. В моем случае оказалось, что мой файл csv содержит только целые столбцы, которые были замечены как строка вместо числовых. Установив dbc.parser в CategoricalDataAsNumberVectorParser, ошибка outofbounds исчезла. Сделав столбцы действительно числовыми, я получил результат, который я хотел.

+0

Что такое поддельные цифры, а не столбцы «действительно числовые»?!? –