Какой самый быстрый и эффективный способ для массового удаления записей hbase? API-интерфейс Hbase или задание MapReduce?Что является самым быстрым и эффективным способом для Hbase bulk delete
ответ
API-интерфейс HBase Client быстрее, потому что вы выполняете операции непосредственно с базой данных при использовании MapReduce, что означает, что задачи будут выполняться над заданиями, и это займет время в соответствии с моим опытом. Более того, этот HBase позволит вам выполнять определенные операции в семействах столбцов, которые MapReduce не может выполнить.
API-интерфейс клиента HBase не позволяет выполнять массовые удаления, если вы не знаете ключей строк для ячеек, которые вы хотите удалить.
Функция BulkDeleteEndpoint может быть использована для выполнения массовых удалений на основе результатов сканирования.
Можете ли вы направить меня к учебнику или веб-сайту, который поможет мне узнать о «BulkDeleteEndpoint» .. Потому что я действительно очень новичок в hadoop и hbase. Спасибо. –
. Вы можете проверить [HBase doc] (https: //hbase.apache.org/devapidocs/org/apache/hadoop/hbase/coprocessor/example/BulkDeleteEndpoint.html) – herberts
Самый быстрый и эффективный способ для больших смежных наборов данных - удалить целые области, удалив их HDFS-каталоги и удалив их из таблицы META. Это практически не требует ввода-вывода, поэтому он почти свободен. Обратите внимание, что это еще не доступно напрямую через API высокого уровня, поэтому вам нужно выполнить скрипт/код для его выполнения.
Вот пример из списков рассылки HBase о том, как вы могли это сделать, используя оболочку.
- Закрыть область от оболочки (прочитать о том, как это работает, используя Shell помощь - не делают отменить назначение)
- Затем просто удалите содержимое региона в HDFS раз регион закрыто (имя региона в HDFS совпадает с регистровым именем, - последняя часть имени региона - check refguide).
- После удаления в HDFS вызовите область назначения.
Источник http://search-hadoop.com/m/YGbbl9ZaSQ2HLT&subj=Re+Delete+a+region+from+hbase
Спасибо .. Я постараюсь сделать это. –
- 1. что является самым быстрым способом извлечения данных из HBase
- 2. Что является самым быстрым способом проверки типа?
- 3. Что является самым быстрым способом раздела данных
- 4. Что является самым эффективным способом отслеживания столкновений
- 5. Что является самым быстрым/наиболее эффективным SQL-драйвером для Python?
- 6. Что является самым быстрым и эффективным способом в iOS для уменьшения HD-видео на SD?
- 7. Android, что является самым эффективным способом сохранения и загрузки изображений?
- 8. Java - что является самым быстрым способом для чтения файла
- 9. Является ли IEnumerable.Max() самым быстрым способом?
- 10. Что является самым эффективным и быстрым способом удаления строки с начала? (PHP-оптимизация)
- 11. Что является самым быстрым способом массовой загрузки данных в HBase программно?
- 12. Что является самым быстрым способом загрузки данных в Matlab
- 13. Что является самым эффективным способом создания частиц на iPhone
- 14. Что является самым эффективным способом создания новой базы данных MySQL
- 15. Что является самым быстрым способом проверки повторяющихся цифр номера?
- 16. Что является самым эффективным способом создания многоязычного сайта
- 17. HBase bulk delete as "full bulk load"
- 18. перекрытие 3 интервалов: что является самым быстрым способом
- 19. Что является наиболее эффективным/быстрым способом многократного использования селектора jQuery?
- 20. Javascript: что является самым эффективным способом получить нижнюю границу нуля?
- 21. $ array ["key"] = значение; или array_merge(), что является самым быстрым способом?
- 22. WPF: что является самым эффективным/быстрым способом добавления элементов в ListView?
- 23. что является самым быстрым способом удаления файлов с помощью R
- 24. Что является самым эффективным способом жесткого кодирования карты в haskell
- 25. Что является самым быстрым переносным способом копирования массива в C++
- 26. Что является самым быстрым способом десериализации JSON в java
- 27. Что является самым быстрым способом запроса к базе данных Android?
- 28. Что является самым быстрым способом сбора символов в java
- 29. Что является самым быстрым способом клонирования объекта несколько раз
- 30. Что является самым быстрым способом преобразования int в char
Hbase cleint быстрее –
чем причина этого? –