Я хочу обработать данные (например, проверить столбцы csv) в HDFS
, используя Falcon. Я успешно установил Falcon (version - Hortonworks Sandbox 2.1, Falcon -0.5.0.2.1.1.0
) и смог подать job. Однако задание не выполняется, и пользовательскому интерфейсу нечего запускать/останавливать работу. Я хочу знать, как проверить вывод задания и перейти к другому заданию в зависимости от проверки первого задания - рабочего процесса.Использование Falcon для обработки больших данных
0
A
ответ
0
Вы упомянули, что работа была отправлена. Если вы используете командную строку apache falcon, недостаточно «отправить», команда «schedule» также должна быть запущена. Для falcon «отправить» задание не будет заходить в запущенное состояние, «график» необходим.
Вы можете обратиться к http://falcon.apache.org/0.6.1/FalconCLI.html за всеми командами.
0
Если вы ищете пользовательскую логику, вы можете создать рабочий процесс oozie, и этот рабочий процесс должен отправить работу falcon в качестве последней задачи.
<process name="sample-process">
...
<workflow engine="oozie" path="/projects/bootcamp/workflow"/>
...
</process>
https://falcon.apache.org/EntitySpecification.html#Process_Specification
Надеется, что это помогает.
Смежные вопросы
- 1. сеанс обработки Python-falcon
- 2. python для обработки больших данных
- 3. Использование Hadoop для параллельной обработки, а не больших данных
- 4. Использование Apache Falcon для настройки репликации данных по кластерам
- 5. Python словарь для обработки больших данных
- 6. оптимизации для обработки больших данных в pyspark
- 7. Использование обработчиков для обработки данных
- 8. Hadoop для обработки больших изображений
- 9. Лучший способ обработки больших данных в C++?
- 10. Язык программирования для обработки больших данных для R
- 11. Инструменты для предварительной обработки больших данных для панелей мониторинга?
- 12. Резервное копирование данных Apache Falcon
- 13. Использование Couchbase для больших наборов данных
- 14. C# Лучший тип/коллекция/список/набор данных для обработки больших больших данных (файлы csv/tab)
- 15. Принимает много времени для обработки больших данных json
- 16. минимальное время обработки и память для больших данных
- 17. Возможная реализация TextView для обработки очень больших данных
- 18. Каковы правильные инструменты для индексации и обработки больших данных?
- 19. MySQL Cluster vs. Hadoop для обработки больших данных
- 20. Библиотека Структура/данные для обработки больших объемов данных
- 21. Falcon & Oozie - Как настроить job.properties для oozie в falcon
- 22. IBM Watson Речь для обработки больших файлов
- 23. Генераторы для обработки больших наборов результатов
- 24. Использование Emacs для больших больших проектов
- 25. Использование awk для обработки базы данных
- 26. Использование jQuery для обработки данных JSON
- 27. Использование Row_Number для обработки не уникальных данных
- 28. Использование памяти в больших манипуляциях/обработке данных
- 29. Система построения Javascript для обработки больших объектов
- 30. Java: чтение больших файлов excel для обработки
Я выполнил команду отправки и расписания 'bin/falcon entity -submitAndSchedule -type примеры файлов процессов/entity/filesystem/pig-process.xml', как описано в [шаги установки] (http: //falcon.apache .org/InstallationSteps.html). Я могу видеть статус работы как работающий в oozie, где статус процесса отображается как UNKNOWN в пользовательском интерфейсе Falcon. Принимая во внимание, что, пожалуйста, помогите в ответе на _выполнение результата задания и перейдите к другому заданию в зависимости от проверки (успеха/неудачи) первой работы? _ – pktippa
в feed.xml вы можете указать тег флажка доступности. Это флаг/файл, для которого будет обозначена полная доступность фида/данных для этого экземпляра. Например, process1 выдает feed1 как output, а feed1 вводится для process2, вы можете указать флаг доступности в файле feed1 xml. Process2 будет ждать, пока этот флаг не появится в feed1, созданный процессом1. В большинстве случаев в системе eco-системы hasoop этот флаг является _SUCCESS, но использование также может его настроить. PLS ссылаются на http://falcon.apache.org/0.6.1/EntitySpecification.html#Feed_Specification и поиск «флаги доступности» –