Я выполняю задания M/R и регистрирует ошибки, когда они возникают, вместо того, чтобы сделать работу неудачной. Есть только несколько ошибок, но задание выполняется на кластере hadoop с сотнями узлов. Как выполнять поиск в журналах задач без необходимости вручную открывать каждый журнал задач в Интернете ui (jobtaskhistory)? Другими словами, как автоматически искать в журналах задач M/R, которые распространяются по всему кластеру, хранятся в каждом узле локально?Как собрать учетные записи Hadoop?
ответ
Side Примечание: Первый 2.0.0 Oldy плесень (это «бета» версия 2.0), вам следует рассмотреть возможность обновления до более нового стека (например, 2.4, 2.5 2.6).
Начиная с версии 2.0, Hadoop реализовал так называемую «агрегацию журналов» (хотя это не то, что вы могли бы подумать. Журналы просто хранятся на HDFS). Существует множество инструментов командной строки, которые вы можете использовать для получения журналов и анализа их без необходимости проходить через интерфейс. Это, на самом деле, намного быстрее, чем пользовательский интерфейс.
Отъезд this blog post для получения дополнительной информации.
К сожалению, даже с помощью инструмента командной строки вам не удается получить все журналы задач одновременно и передать его на что-то вроде grep. Вам нужно будет получить каждый журнал задач как отдельную команду. Однако это, по крайней мере, сценарий.
Сообщество Hadoop работает над более надежным инструментом анализа журналов, который не только сохранит журналы работы на HDFS, но также даст вам возможность выполнять поиск и другие анализы в этих журналах. Однако это инструмент по-прежнему является выходным.
Спасибо за ссылку! Я также обновляю кластер Hadoop. – pgrandjean
Вот как мы это сделали (крупная интернет-компания): мы убедились, что были зарегистрированы только критические сообщения: но для этих сообщений мы фактически использовали System.err.println. Пожалуйста, сохраняйте сводные сообщения на трекер/редуктор до нескольких килобайт.
Большинство сообщений должны по-прежнему использовать стандартный механизм log4j (который идет в области системных журналов)
- 1. Учетные записи пользователей для демонов Hadoop
- 2. Учетные записи Django, расширяющие учетные записи
- 3. Как собрать статус контролера отслеживания hadoop?
- 4. Hadoop - Как собрать текст без знака
- 5. Как проверить новые учетные записи
- 6. Как остановить учетные записи спама
- 7. Как отключить учетные записи пользователей
- 8. Считайте учетные записи зарегистрированными
- 9. рельсы: учетные записи пользователей
- 10. Клиентские учетные записи переключения
- 11. Неполные учетные записи пользователей
- 12. Учетные записи Java Youtube?
- 13. Поддельные учетные записи Facebook
- 14. Дубликат Учетные записи пользователей
- 15. act_as_commentable_with_threading + учетные записи пользователей
- 16. Учетные записи Google OAuth2?
- 17. Как собрать записи из файла YAML?
- 18. Actionscript 3- Как создать учетные записи пользователей, учетные записи и учетные записи администратора (возможно, с помощью API)
- 19. Учетные записи учетной записи PayPal для разработчика
- 20. Hadoop: Как собрать результат сокращения в Java HashMap
- 21. AccountManager возвращает пустые учетные записи
- 22. RegEx - отфильтровать учетные записи службы
- 23. Получить учетные записи-github accesstoken
- 24. Pinax Регистрация и учетные записи
- 25. Htaccess и учетные записи пользователей
- 26. Учетные записи службы Active Directory
- 27. Учетные записи пользователей, использующие PostgreSQL
- 28. Учетные записи Nexus в Jenkins
- 29. Зарегистрированные учетные записи электронной почты
- 30. Учетные записи С ролями MeteorJS
Какую версию Hadoop вы используете? –
Я использую Hadoop 2.0.0. – pgrandjean