Я просто пытаюсь оценить HBase для некоторых данных, которые мы делаем.HBase Mapreduce на нескольких объектах сканирования
HBase будет содержать данные о событиях. Ключ будет eventId + время. Мы хотим провести анализ нескольких типов событий (4-5) между диапазоном дат. Общее количество событий составляет около 1000.
Проблема с запуском задания mapreduce в таблице hbase заключается в том, что initTableMapperJob (см. Ниже) занимает всего 1 объект сканирования. По соображениям производительности мы хотим проверять данные только на 4-5 типов событий в диапазоне дат, а не на 1000 типов событий. Если мы используем метод ниже, я думаю, у нас нет такого выбора, потому что он принимает только 1 объект сканирования.
государственной статической силы (таблица String, сканирования Scan, Класс картографа, Класс outputKeyClass, Класс outputValueClass, org.apache.hadoop.mapreduce.Job работа) initTableMapperJob бросает IOException
Можно запустить mapreduce в списке объектов сканирования? любой обходной путь?
Благодаря
Не могли бы вы проверить http: // stackoverflow.com/questions/11353911/extend-hadoops-tableinputformat-to-scan-with-pre-used-used-for-distribution? – marcog