При поиске клиента python для Hadoop я нашел два модуля pydoop и hadoopy. Кажется, что оба они достаточно хороши для работы, но не уверены, какие из них имеют больше преимуществ, чем другие, чтобы установить их.pydoop vs hadoopy - hadoop python client
1
A
ответ
3
Наиболее полная документация этого, я думаю, http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/
В последнее время, я действительно думаю, что mrjob вышел вперед, как явный лидер. У него очень активный список рассылки, и он выглядит относительно стабильным и современным. Он также имеет приятную интеграцию с Amazon EMR.
Смежные вопросы
- 1. Python 2.7.6 установка Pydoop неудачу на Ubuntu
- 2. Hadoopy не пройдет мимо mkdir
- 3. Ошибка Pydoop в Jupyter
- 4. Java vs Python on Hadoop
- 5. Pydoop работа не работает
- 6. HADOOP_CONF_DIR не найдена ошибка в python pydoop program
- 7. Список всех файлов в HDFS Python без pydoop
- 8. Hive JDBC Vs CLI client
- 9. Сохранение файла gzip с pydoop в python
- 10. Hadoop API VS. Hadoop Streaming
- 11. Hadoop Ha namenode java client
- 12. Pydoop Java home не установлен вопрос установки
- 13. Fat/Thick Client vs Thin Client
- 14. socket.io-client vs socket.io
- 15. копирование файла в hdfs с помощью pydoop
- 16. Pydoop stucks на readline из файлов HDFS
- 17. Hadoop vs Hazelcast
- 18. Spark vs Hadoop
- 19. Hadoop Vs Data Lake
- 20. Использование разных hadoop-mapreduce-client-core.jar для запуска клана hadoop
- 21. Установка pydoop 1.0.0-rc1 на CDH 5.3.0
- 22. Filezilla client vs filezilla server
- 23. WCF timeout client vs server
- 24. Solr PHP client vs file_get_contents?
- 25. SVN Client vs Repository Browser
- 26. Atlassian Stash vs Git Client
- 27. client-MVC vs server-MVC
- 28. WCF Client CloseAsync vs Abort()
- 29. node JS client vs server