kd-tree сложность алгоритма BBF времени

Я hava 2000 точек с 5000 измерениями, и я хочу получить ближайшего соседа.kd-tree сложность алгоритма BBF времени

Теперь у меня есть некоторые проблемы, может кто-нибудь дать ответ.

Люди говорят, что он работает хорошо с высокими размерами. Какова временная сложность?
@param max_nn_chks поиск обрезается после изучения этого много записей дерева

После прочтения алгоритма, интересно, если я хотел бы получить неправильный ответ, когда я поставил max_nn_chks слишком низко. Если да, то просто скажите мне, как установить этот параметр, иначе объясните, спасибо.
Является ли kdtree лучшими Data Structures для моих данных, чтобы получить ближайший сосед?

2013-07-05 karl li

На самом деле я знаю только людей, говорящих о том, что k-d-tree do ** не ** хорошо работают с данными высокого уровня. –

Но есть алгоритм BBF, который меняет способ поиска, который может работать в высокоразмерных –

Временная сложность в основном такая же, как и в ограниченном поиске KD-Tree плюс некоторые мало времени для поддержания очереди приоритетов. Ограниченный алгоритм поиска KD-деревьев должен пересекать дерево на своей полной глубине (log2 от счетчика точек) до предела (максимальное количество листовых узлов/точек, разрешенных для посещения).
Да, вы получите неправильный ответ, если предел слишком низок. Вы можете измерить только долю истинного NN в сравнении с количеством найденных узлов листа. Из этого вы можете определить оптимальное значение.
Обычно рандомизированное дерево kd-деревьев и иерархическое дерево k-средних лучше всего работают. FLANN предоставляет метод определения того, какой алгоритм использовать (k-средство против рандомизированного kd-дерева леса) и устанавливает для вас оптимальные параметры.

Структура данных также оказывает большое влияние. Если вы знаете, что есть скопления точек, которые находятся близко друг к другу, например, вы можете сгруппировать их в одном узле дерева (например, представить их по центроиду) и ускорить поиск.

В данных могут использоваться другие методы, такие как визуальные слова, PCA или случайные проекции. Это довольно активная область исследований.

источник

2016-07-20 16:58:17 Libor

kd-tree сложность алгоритма BBF времени

ответ

Смежные вопросы