2015-12-27 6 views
0

У меня есть файл на машине Ubuntu, который я хочу прочитать в искры Apache.Прочтите файл csv в Apache Spark из удаленного местоположения (ftp)

Я нашел этот пример:

object BasicTextFromFTP { 
    def main(args: Array[String]) { 
     val conf = new SparkConf 
     conf.setMaster(args(0)) 
     val sc = new SparkContext(conf) 
     val file = sc.textFile("ftp://anonymous:[email protected]/ubuntu/ls-LR.gz") 
     println(file.collect().mkString("\n")) 
    } 
} 

по этой ссылке:

https://github.com/databricks/learning-spark/blob/master/src/main/scala/com/oreilly/learningsparkexamples/scala/BasicLoadTextFromFTP.scala

Я не понимаю, как создается URL. Пожалуйста, помогите мне с этим.

+1

Проверьте это: https://en.wikipedia.org/wiki/Uniform_Resource_Locator#Syntax –

ответ

3

Базовая структура URL является типом схемы (здесь ftp) с последующим

//<user>:<password>@<host>:<port>/<url-path> 

, где каждая часть за исключением хост может быть опущена.

Смежные вопросы