Мне нужно написать MapReduce Job, которое получает все строки в заданном диапазоне дат (скажем, последний месяц). Это был бы прозвище, когда My Row Key начинался с Date. Но мои частые запросы Hbase начинаются с значений ключа.Как эффективно сканировать строки HBase
Моя строка с ключом точно равна A | B | C | 20120121 | D. Если комбинация A/B/C вместе с датой (в формате YearMonthDay) делает уникальный идентификатор строки.
Мои таблицы Hbase могут иметь до нескольких миллионов строк. Должен ли мой Mapper читать всю таблицу и фильтровать каждую строку, если она попадает в заданный диапазон дат или Scan/Filter, может помочь справиться с этой ситуацией?
Может ли кто-нибудь предложить (или фрагмент кода) способ эффективно справиться с этой ситуацией?
Благодаря -Panks
Почему вы не копируете содержимое таблицы в новую с измененным ключом и записью старого? – Mario
@Mario Что делать, если таблица имеет триллион ключей? И ему нужно делать это часто? – markg