У меня есть приложение, которое использует Spark для обработки данных и сохраняет его как RDD; Я инициализирую SparkContext с атрибутом «local». Я хочу использовать Mahout в этом наборе данных, но каков наилучший способ поделиться этими данными между двумя приложениями?Делитесь данными между Spark и Hadoop (Mahout)
Я новичок в экосистеме больших данных, поэтому ответ для меня не очень очевиден.
p.s. Я также установил Hadoop локально с помощью этого руководства http://amodernstory.com/2014/09/23/installing-hadoop-on-mac-osx-yosemite/ и смог запустить его.