Честно говоря я не уверен, если эта функция существует? Жаль чтоЗагрузить Спарк RDD к ОТДОХНУТЬ методу POST вебсервис
Мое требование, чтобы отправить искрой проанализировали данные в файл-сервер на ежедневной основе, файловый сервер поддерживает передачу файлов через SFTP и REST Webservice.
Первоначальная мысль заключалась в том, чтобы сэкономить Spark RDD на HDFS и перенести на сервер файлов через SFTP. Я хотел бы знать, можно ли загрузить RDD напрямую, вызвав службу REST из класса искрового драйвера без сохранения в HDFS. Размер данных меньше 2 МБ
Извините за мой плохой английский!
Я хочу указать, что на самом деле вам не нужно собирать() результаты POST для веб-службы. Если используется RDD, а не набор результатов - каждый исполнитель сделает вызовы веб-службы для своих разделов. В некоторых случаях может потребоваться запрос параллельного веб-сервиса. –