У меня есть прецедент, в котором у нас есть большой объем данных, по которым аналитику нужно выполнить. Данные будут непрерывно отобраны и аналитичны для выполнения во время выполнения. Для этого варианта использования, который будет лучше всего использовать, Hbase + hive или HDFS + hive. Насколько я читал, я обнаружил, что в течение времени выполнения изменений лучше всего использовать Hbase. Нуждалось в некоторых предложениях и советах. Пожалуйста, не стесняйтесь предоставлять свои материалы.Hbase или hdfs, которые будут лучше
Если у вас есть такой случай использования, вы можете привести пример, это будет здорово. Заранее спасибо
Верно, что в общем случае HBase может давать лучшую задержку, чем Hive + MR. Однако многое также должно зависеть от особенностей вашего варианта использования. Например, нужно ли аналитике выполнять реляционные объединения между большими наборами отдельных данных? Этот вариант использования не совсем подходит для HBase. – rchang