Я искал способ отслеживания производительности в Spark на Bluemix. Я знаю, что в проекте Apache Spark они предоставляют услугу метрики, основанную на Coda Hale Metrics Library. Это позволяет пользователям сообщать показатели Spark различным приемникам, включая файлы HTTP, JMX и CSV. Подробности здесь: http://spark.apache.org/docs/latest/monitoring.htmlХарактеристики Bluemix Apache Spark
Кто-нибудь знает, как это сделать в службе Bluemix Spark? В идеале я хотел бы сохранить метрики в файле csv в хранилище объектов.
Оцените справку.
Благодаря
Saul
Да, я видел некоторые вещи на сервере истории Spark. Могу ли я получить доступ к данным JSON через мой браузер? –
Файлы JSON должны отражать те же данные, которые вы можете получить через ссылку сервера истории Spark на боковой панели. Под «... через мой браузер» вы подразумеваете загрузку? –
Я понимаю, что для доступа к данным через браузер или через curl или другие методы, должен быть rest-api, которого нет. В каталоге журнала событий установлено значение/gpfs / fs01/user/USER- ID/события. Если это похоже на искру с открытым исходным кодом, это означает, что в этом каталоге есть журнал событий. Я имею в виду, могу ли я получить доступ к этому журналу? –