2015-07-14 3 views
0

В моем проекте я бросаю вызов методу хранения данных. Во-первых, в моем проекте есть потоковые данные в формате JSON, а наиболее подходящим db является MongoDB. Я должен анализировать данные с помощью Hadoop или Spark.можно хранить данные mongodb по hdfs

Итак, мой конфликт начинается здесь: Могу ли я хранить коллекции MongoDB в HDFS или должен быть единиц MongoDB и HDFS? Это важный вопрос для моего решения. Должен ли я использовать Hadoop и MongoDB в тех же дисковых устройствах или отдельных устройствах?

+0

[Обзор интеграции Hadoop и MongoDB] (https://www.mongodb.com/hadoop-and-mongodb), [Использование MongoDB с Hadoop & Spark: часть 1] (https://www.mongodb.com/ [Использование MongoDB с Hadoop & Spark: часть 2] (https://www.mongodb.com/blog/post/using-mongodb). -hadoop-spark-part-2-hive-example), [Использование MongoDB с Hadoop & Spark: часть 3] (https://www.mongodb.com/blog/post/using-mongodb-hadoop-spark-part- 3-искровым пример-ключ-вынос). – zero323

+0

@ zero323, я прочитал этот учебник раньше, но мой вопрос заключается в том, чтобы использовать хадоп и монгодб вместе. я спросил, что, когда я использую оба из них, мне нужен два отдельных кластера друг для друга или я могу использовать их оба в одном кластере? – trallallalloo

ответ

0

Они должны быть разными единицами, поскольку методы хранения, реализации политики безопасности и механизмы хранения сами по себе различны.

Смежные вопросы