0
Impala поддерживает прямой запрос данных в индексах Hadoop с распределенной файловой системой (HDFS) и HBase (база данных NoSQL), поддерживает ли она mongodb (база данных NoSQL)?Является ли Cloudera impala поддержкой mongodb?
прошлой ночью, я нашел «Давайте посмотрим на реальную жизнь пример Intergrating Impala с MongoDB. Компания под названием Stripe (веб и мобильные платежи для разработчиков) выбежали в ту же проблему, описанной выше. Они необходимы для обеспечения сообщая о своих данных MongoDB, но база данных не была способна обеспечить качество отчетности, необходимую для их бизнеса. В качестве базы данных приложений MongoDB отлично работает, но в качестве аналитической базы данных не так много, но это нормально, поскольку это было никогда не был таким, чтобы быть одним. " в книге. –
Stripe создал библиотеку для этого под названием ZeroWing (https://github.com/stripe/zerowing). Похоже, что он способен имитировать элемент набора реплик Mongo и передавать данные oplog непосредственно в HBase. Затем Impala можно использовать для запроса данных в HBase. –