У меня есть мое требование к проекту, в котором для анализа данных используется один скрипт python. Раньше я использовал txt-файлы в качестве входа в этот скрипт python. Но по мере роста данных я должен переключить свою платформу хранения на Hadoop HDFS. Как я могу получить данные HDFS в моем сценарии python? Есть ли способ сделать это? Заранее спасибо.Можно ли интегрировать Hadoop с Python?
ответ
Hadoop Streaming API:
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \
-input myInputDirs \
-output myOutputDir \
-mapper /bin/cat \
-reducer /bin/wc
Все, что вам нужно знать о том, что здесь: http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/
Это то, что я ищу. Итак, в основном все будет обрабатываться Hadoop-streaming.jar? Нет необходимости в дополнительной работе. Правильно ли? –
Да, это правильно. –
В дополнение к другим подходам, вы можете также встраивать Pig Latin заявления и команды Pig в сценарии Python используя JDBC-подобную компиляцию, привязку, модель запуска. Для Python убедитесь, что jython jar включен в ваш путь к классу. Обратитесь к документации по Apache для получения более подробной информации: https://pig.apache.org/docs/r0.9.1/cont.html#embed-python
- 1. Можно ли интегрировать Kdb + и hadoop?
- 2. Можно ли использовать hadoop только с python?
- 3. Как интегрировать Cassandra с Hadoop
- 4. Ищете Гео пространственную библиотеку можно интегрировать с Hadoop
- 5. Как интегрировать matlab с hadoop
- 6. Как интегрировать? Hadoop с Mysql
- 7. Можно ли интегрировать python с c для производительности?
- 8. Можно ли интегрировать Python или Perl с Ruby?
- 9. Можно ли интегрировать IdentityServer3 с BOX?
- 10. Можно ли интегрировать Spring MVC с Guice?
- 11. Можно ли интегрировать JQuery с Eclipse?
- 12. Можно ли интегрировать Resharper-кли с TFS
- 13. Можно ли интегрировать Dynamodb с Wavemaker?
- 14. Можно ли интегрировать html с asp.net?
- 15. Можно ли интегрировать кибану с кендо-ии?
- 16. Можно ли интегрировать ExtJs 5 с Wijmo?
- 17. Можно ли использовать Avro с Hadoop 0.20?
- 18. Как интегрировать NLTK с Hadoop HDFS?
- 19. Как интегрировать hadoop с zookeeper и hbase
- 20. Можно ли интегрировать RxJS/Most Observable?
- 21. Можно ли интегрировать SWF в приложение Java?
- 22. Можно ли интегрировать Cake-Pattern и макросы?
- 23. Можно ли интегрировать Joomla и Codeigniter?
- 24. Можно ли интегрировать iAd или AdMob
- 25. можно ли интегрировать Adobe Acrobat pdf editor
- 26. Можно ли интегрировать iFrame в файл PHP?
- 27. Можно ли интегрировать Redmine на другой сайт?
- 28. Можно ли интегрировать Datatables в Yii?
- 29. Можно ли интегрировать изменения в ветвь выпуска?
- 30. Как интегрировать eclipse и hadoop 2.6
Использование Hadoop для использования python, php и т. Д. Ex: hasoop jar hasoop/tools/lib/hadoop-streaming-2.7.2.jar -mapper /mapper.php -reducer/reducer.php -input/hdfsinputpath -output/hdfsoutputpath –
Это может помочь: http://stackoverflow.com/questions/12485718/python-read-file-as-stream-from-hdfs –