2015-03-10 2 views
-1

Что лучше всего подходит (или существующий алгоритм, библиотека), чтобы получить лучшие предметы из большого набора данных местоположения (широта, долгота); скажем, есть хиты местоположения + 1M, и цель состоит в том, чтобы получить лучшие 100 предметов, которые обычно описывают весь путь (для каждого запроса пользователя)Получение наилучших местоположений

Я думал о предварительном расчете для набора «лучших предметов» (на основе предопределенных временных интервалов) разделы), всякий раз, когда приходит новая запись; но я не уверен, что об этом

P.S: Я использую Java для языка программирования, & MongoDB для хранения серверной

ответ

0

вы спрашиваете о 100 ближайших местах? Если это так, вы описали проблему n-Nearest-Neighbors.

Лучшее, что нужно сделать, это построить kd-tree, а затем выполнить поиск, как описано в статье wikipedia.

Есть много реализаций этого, например, в питоне в scikit-learn

Если вы имеете в виду что-то другое на «лучший», я боюсь, что вы будете нуждаться в дальнейшей разработке.

+0

Предположим, у нас есть информация о местоположении 1M. (в виде широты, долготы) между точкой A и точкой B. Цель состоит в том, чтобы получить максимум 100 предметов между этими 1M-записью, которые могут описывать весь путь между позицией: A до позиции: B (наилучшим образом) – nima

Смежные вопросы