Что является самым быстрым и эффективным способом для Hbase bulk delete

Какой самый быстрый и эффективный способ для массового удаления записей hbase? API-интерфейс Hbase или задание MapReduce?Что является самым быстрым и эффективным способом для Hbase bulk delete

источник

2016-03-16 Anuradha Gunasekara

Hbase cleint быстрее –

чем причина этого? –

API-интерфейс HBase Client быстрее, потому что вы выполняете операции непосредственно с базой данных при использовании MapReduce, что означает, что задачи будут выполняться над заданиями, и это займет время в соответствии с моим опытом. Более того, этот HBase позволит вам выполнять определенные операции в семействах столбцов, которые MapReduce не может выполнить.

источник

2016-03-17 11:28:28

API-интерфейс клиента HBase не позволяет выполнять массовые удаления, если вы не знаете ключей строк для ячеек, которые вы хотите удалить.

Функция BulkDeleteEndpoint может быть использована для выполнения массовых удалений на основе результатов сканирования.

источник

2016-03-18 22:47:52 herberts

Можете ли вы направить меня к учебнику или веб-сайту, который поможет мне узнать о «BulkDeleteEndpoint» .. Потому что я действительно очень новичок в hadoop и hbase. Спасибо. –

. Вы можете проверить [HBase doc] (https: //hbase.apache.org/devapidocs/org/apache/hadoop/hbase/coprocessor/example/BulkDeleteEndpoint.html) – herberts

Самый быстрый и эффективный способ для больших смежных наборов данных - удалить целые области, удалив их HDFS-каталоги и удалив их из таблицы META. Это практически не требует ввода-вывода, поэтому он почти свободен. Обратите внимание, что это еще не доступно напрямую через API высокого уровня, поэтому вам нужно выполнить скрипт/код для его выполнения.

Вот пример из списков рассылки HBase о том, как вы могли это сделать, используя оболочку.

Закрыть область от оболочки (прочитать о том, как это работает, используя Shell помощь - не делают отменить назначение)

Затем просто удалите содержимое региона в HDFS раз регион закрыто (имя региона в HDFS совпадает с регистровым именем, - последняя часть имени региона - check refguide).

После удаления в HDFS вызовите область назначения.

Источник http://search-hadoop.com/m/YGbbl9ZaSQ2HLT&subj=Re+Delete+a+region+from+hbase

источник

2016-03-18 23:05:59

Спасибо .. Я постараюсь сделать это. –

Что является самым быстрым и эффективным способом для Hbase bulk delete

ответ

Смежные вопросы