2015-09-23 2 views
0

Я начинаю ELKI, и я использую его для группировки около 10 тыс. Точек с помощью. CSV-файла. Как только я верну свои настройки, я бы хотел увеличить до 1MM очков.Как индексировать с кластеризацией ELKI - OPTICS

Я использую алгоритм OPTICSXi с LngLatDistanceFunction

я храню читать о «позволяя R * -tree индекс с STR массовой загрузки», чтобы увидеть значительные улучшения в производительности. Учебники не очень помогли мне.

Любые советы о том, как я могу реализовать эту функцию?

+1

Используйте '-db.index' параметра для добавления индекса. используйте опцию массовой загрузки для настройки массовой загрузки. –

ответ

1

Предложенные параметры с использованием пространственной R * индекса на 2 мерных данных являются:

-db.index tree.spatial.rstarvariants.rstar.RStarTreeFactory 
-pagefile.pagesize 512 
-spatial.bulkstrategy SortTileRecursiveBulkSplit 

Для более высоких пространственных данных, больших размеров страниц необходимы. Размер страницы 512-1024 байта, по-видимому, является сладким пятном для двухмерных данных, но он также зависит от ваших данных.

Для Дискретизируют кластеры можно использовать экстракцию Xi:

-algorithm clustering.optics.OPTICSXi -opticsxi.xi 0.005 

Чтобы извлечь выгоду из индекса ускорения с OPTICS, выберите эпсилон как можно для вашего приложения. Параметр находится в метрах со всеми земными моделями в ELKI.

-opticsxi.algorithm OPTICSHeap 
-algorithm.distancefunction geo.LatLngDistanceFunction 
-optics.epsilon 2000.0 -optics.minpts 10 

использует максимум на 2 км.

Обязательно укажите latitude,longitude и longitude,latitude. Оба ордера используются, и вы нужны использовать правильную функцию расстояния:

geo.LatLngDistanceFunction 
geo.LngLatDistanceFunction 
+0

Спасибо! В пользу тех, кто следует, вот что я выполнения, который, кажется, работает очень хорошо на моем конкретном наборе данных: Java -jar кли -алгоритм clustering.optics.OPTICSXi -dbc.in -db.index дерева .spatial.rstarvariants.rstar.RStarTreeFactory -pagefile.pagesize 1024 -spatial.bulkstrategy SortTileRecursiveBulkSplit -opticsxi.xi 0.006 -optics.minpts 5 -algorithm.distancefunction geo.LngLatDistanceFunction -geo.model WGS84SpheroidEarthModel -opticsxi.algorithm OPTICSHeap -resulthandler ResultWriter -out Josh

Смежные вопросы