Если во время работы простой группы по сценарию в свинге для больших терабайт данных, скрипт застрял на 70%, то что можно сделать, чтобы диагностировать проблему?Как отлаживать скрипт свиньи
ответ
Существует несколько способов отладки сценария свиньи. Простым методом является поэтапное выполнение отношения, а затем проверка результата. Эти команды полезны для отладки сценария свиньи.
DUMP - Используйте оператор DUMP для запуска (выполнения) выписей из латинского алфавита и отображения результатов на экране.
ILLUSTRATE - Используйте оператор ILLUSTRATE, чтобы просмотреть, как данные преобразуются через последовательность выражений Pig Latin. ILLUSTRATE позволяет протестировать ваши программы на небольших наборах данных и получить более быстрое время обработки.
EXPLAIN - Используйте оператор EXPLAIN для просмотра логических, физических и картографических планов выполнения, которые используются для вычисления указанной связи.
ОПИСАНИЕ - Используйте оператор DESCRIBE для просмотра схемы отношения. Вы можете просматривать внешние отношения, а также отношения, определенные во вложенном заявлении FOREACH.
Подробнее об этих командах можно найти на этом link. Также обратитесь к developing and testing a pig script., чтобы узнать подробности.
Если вы хотите отладить весь скрипт во время выполнения, то вам нужно написать ниже код в начало вашего скрипта
-- set the debug mode on
SET debug 'on'
-- set a job name of your job.
SET job.name 'my job'
Это позволит запустить скрипт в режиме отладки. подробно о состоянии около SET
команда доступна на этом link
Когда вы говорите, что скрипт застрял на 70%, я полагаю, вы имеете в виду, что работа MR составляет 70%.
Лучше всего просмотреть журналы MR и YARN (и, если необходимо, журналы HDFS), для получения дополнительной информации о том, что делает MR/YARN. Журналы обычно можно найти под /var/log/hadoop-mapreduce и /var/log/hadoop-hdfs в Cloudera Manager управляемые кластеры. Возможно, вам придется исследовать журналы с нескольких узлов в кластере, где запущены YNNNodeManager.
В случае, если ваш скрипт застрял с вопросом Pig (т.е. проблема в Pig коде, не MR/HDFS код), это полезно для повышения уровня log4j ведения журнала в Pig: свинья -d DEBUG является команда line, чтобы установить уровень ведения журнала на DEBUG, например.
- 1. Как отлаживать скрипт Perl?
- 2. Как отлаживать AJAX скрипт
- 3. Как правильно отлаживать Баш скрипт
- 4. Как отлаживать скрипт, используя XDebug
- 5. Как отлаживать скрипт PHP, который не выполняется?
- 6. Как отлаживать скрипт python, который сбой python
- 7. Как отлаживать скрипт в конфигурации модуля?
- 8. Netsuite: как отлаживать скрипт действия рабочего процесса
- 9. Как отлаживать скрипт с помощью журнала модуля
- 10. Многопоточный скрипт python молча умирает - как отлаживать
- 11. как отлаживать длинный скрипт в студии управления?
- 12. Как отлаживать скрипт js, имя которого изменяется
- 13. PHP-скрипт ничего не делает. Как отлаживать?
- 14. Дата свиньи свиньи в yyyy-MM-dd
- 15. Запуск свиньи в java без встраивания скрипта свиньи
- 16. скрипт свиньи: count возвращает 0 на нулевом поле
- 17. Свиньи через PHP
- 18. Magento не может отлаживать установочный скрипт
- 19. не удалось выполнить скрипт свиньи для Hue-2.5.0
- 20. Ошибка сценария хранения свиньи
- 21. Оптимизация скрипта свиньи
- 22. Как запустить сценарий свиньи в фоновом режиме?
- 23. Как отлаживать (желательно в среде IDE) скрипт MSBuild?
- 24. Как я могу отлаживать, какой скрипт пытается использовать API геолокации?
- 25. Как отлаживать скрипт plperl в триггере postgres-8.4
- 26. Как отлаживать контент-скрипт, загруженный в расширение Firefox
- 27. Как отлаживать скрипт tcl, являющийся аргументом для исполняемого файла?
- 28. Как отлаживать скрипт поиска рекурсивного каталога в PHP?
- 29. Как отлаживать скрипт Python, который автоматически вызывается внутри веб-приложения?
- 30. Как отлаживать скрипт PHP, который никогда не заканчивает загрузку?