Предложенные параметры с использованием пространственной R * индекса на 2 мерных данных являются:
-db.index tree.spatial.rstarvariants.rstar.RStarTreeFactory
-pagefile.pagesize 512
-spatial.bulkstrategy SortTileRecursiveBulkSplit
Для более высоких пространственных данных, больших размеров страниц необходимы. Размер страницы 512-1024 байта, по-видимому, является сладким пятном для двухмерных данных, но он также зависит от ваших данных.
Для Дискретизируют кластеры можно использовать экстракцию Xi:
-algorithm clustering.optics.OPTICSXi -opticsxi.xi 0.005
Чтобы извлечь выгоду из индекса ускорения с OPTICS, выберите эпсилон как можно для вашего приложения. Параметр находится в метрах со всеми земными моделями в ELKI.
-opticsxi.algorithm OPTICSHeap
-algorithm.distancefunction geo.LatLngDistanceFunction
-optics.epsilon 2000.0 -optics.minpts 10
использует максимум на 2 км.
Обязательно укажите latitude,longitude
и longitude,latitude
. Оба ордера используются, и вы нужны использовать правильную функцию расстояния:
geo.LatLngDistanceFunction
geo.LngLatDistanceFunction
Используйте '-db.index' параметра для добавления индекса. используйте опцию массовой загрузки для настройки массовой загрузки. –