Предположительно у меня есть большие независимые наборы данных в отдельных файлах excel.hasoop map reduce vs clojure pmap function
С точки зрения эффективности выполнения, было бы лучше использовать функцию clojure Pmap для обработки данных или сокращения карты hadoop?
Каждый файл Excel содержит примерно 34000 строк по крайней мере, и у меня их довольно много.
К сожалению для начинающих вопрос, как я относительно новым для обоих, и проводят исследования на них
Как некоторые из вас, ребята объяснили,
Возможно, еще один вопрос будет сравнивать Clojure PMAP против экземпляра запуска нескольких экземпляров одних и тех же копий программного обеспечения, каковы различия между ними?
Единственное, что я могу думать о том, что ртар может принимать любое количество переменных, однако, чтение одного файла для каждого экземпляра приложений потребует количество файлов, которые будут известны заранее и экземпляры инициализироваться
См: [Нужна ли мне SQL или Hadoop? Блок-схема] (http: //www.aaroncordova.com/2012/01/do-i-need-sql-or-hadoop-flowchart.html) - s/SQL/pmap/ – noahlz