2013-06-17 5 views
3

Я создаю таблицы в улье для пространственной базы данных, я знаю, что существуют специальные индексы для пространственных данных, которые являются R-деревом. В улье создать пространственный индекс невозможно (я думаю). Я думал о попытке сделать индекс x, y (long, lat), непрерывных переменных с десятичными знаками. Я не думаю, что это наиболее эффективно.Пространственный индекс на кусте

Мы используем библиотеки esri для пространственной алгебры, но в некоторых случаях производительность запросов очень плохая.

Esri gis tools for hadoop

Я думал ....

ли лучше создать индекс для этих двух переменных, или разбить таблицу переменной типа XI = Int (х/0.2) * 0,2, yi = int (y/0,2) * 0,2?

Я думаю, что таблица разделов является более эффективным, но дизайн более сложные запросы, и я думаю, что раздел не поддерживает числовые переменные с десятичными знаками

Наиболее типичные запросы с ограничивающего параллелепипеда будет диапазон пространственные данные. Кто-нибудь знает эффективный способ структурирования данных с улей для подобных запросов?

Есть ли способ создать и внедрить R-дерево в куст? Можете ли вы разбить таблицу с непрерывными значениями с десятичными знаками (я видел много примеров и, кажется, нет)?

+0

Что именно означает «разделение таблицы с непрерывными значениями»? – climbage

+0

Вы также можете быть заинтересованы в: Randall T. Whitman, Michael B. Park, Sarah M. Ambrose и Erik G. Hoel. 2014. Пространственное индексирование и аналитика на Hadoop. В * Трудах 22-й Международной конференции ACM SIGSPATIAL по достижениям в области географических информационных систем * (SIGSPATIAL '14). ACM, Нью-Йорк, Нью-Йорк, США, 73-82. DOI = 10.1145/2666310.2666387 http://doi.acm.org/10.1145/2666310.2666387 –

ответ

0

Существует также k-мерное дерево для пространственных данных, с которыми мне гораздо проще работать.

0

Я видел только примеры разделов с датами. Тиле 2012, 2013 .... и т. Д. Это действительно дискретные значения. Я не знаю, можете ли вы определить раздел с диапазонами, например: y в [40.1, 42.4) и x в [-4,0), другое утверждение y в [42.4, 43) и x в [-4, 0) ... и т. д. Разделы не имеют статичных диапазонов, потому что будут пространственные области, которые не имеют большой информации. Это способ сделать Quadtree http://en.wikipedia.org/wiki/Quadtree, но связан с разделами без индекса. Я думаю, что это будет работать как пространственный индекс, будет работать в улье и, может быть, изящным способом.

Это моя идея. Я надеюсь, что кто-то найдет способ сделать перегородки, а также, и самое главное, что х и у являются переменными, которые определяют раздел для проверки, или элегантный альтернатива

Это пример, чтобы сделать разделы

CREATE продажи ТАБЛИЦА ( sales_order_id BIGINT, ORDER_AMOUNT FLOAT, ORDER_DATE STRING, due_date STRING, customer_id BIGINT ) PARTITIONED страна (STRING, год, месяц INT INT, INT день);

Смежные вопросы