2014-12-08 5 views
2

Я хотел бы прочитать файл из HDFS в Spark через httpfs или Webhdfs. Что-то вдоль линийSpark с Webhdfs/httpfs

sc.textFile ("webhdfs: // MyHost: 14000/webhdfs/v1/путь/к/file.txt")

или, в идеале,

sc.textFile ("httpfs: // MyHost: 14000/webhdfs/v1/путь/к/file.txt")

есть ли способ, чтобы получить искру, чтобы прочитать файл через Webhdfs/httpfs ?

ответ

0

Я считаю, что WebHDFS/HttpFS похожи на потоковые источники для передачи данных через REST-API.

Затем Spark Streaming может использоваться для приема данных из WebHDFS/HttpFS.

+0

Привет Vijay, вы можете обеспечить более подробно об этом? –

Смежные вопросы