2016-05-24 11 views
0

У меня есть многомерные векторы с n-градусами. Каков наилучший способ справиться с ними.Хранение и сравнение многомерных векторов

  • хранения (что это лучший способ для их хранения, SQL, Монго, документ?)
  • Сравнение (Как сравнить два из них и найти сходство).

Пример:

a{1,3,4,1,-1}, 
b{2,3,3,0,0}, 
c{2,3,2,8,9} 

Если сравнить два выше, a и b более похожи.

Как сделать это в больших масштабах? Я хочу хранить тысячи таких векторов.

Сходство может быть расстоянием между векторами. Vector Distance

+0

ли n' фиксированные 'или она может меняться? Должно ли хранилище обрабатывать векторы с разными значениями 'n'? –

+0

Почему 'a' и' b' 'более похожи' (чем что)? Каков алгоритм вычисления подобия? Вы хотите рассчитать сходство между каждой парой векторов? –

+0

Сходство - это векторное расстояние (обновленный вопрос). И да, n постоянна. – Codevalley

ответ

2

Моя ставка для хранения была бы в базе данных Graph, например Neo4j. Вы можете вычислить эвклидовое расстояние (и, возможно, реализовать кластер k-mean для получения ближайших точек) с использованием запроса Cypher.

Для получения дополнительной информации о выполнении, проверьте следующие статьи -

Смежные вопросы