Я пытаюсь прочитать файл csv в dataframe. Я знаю, какой должна быть схема моего фреймворка, поскольку я знаю свой файл csv. Также я использую искровый пакет csv для чтения файла. Я пытаюсь указать схему, как показано ниже.Предоставить схему при чтении файла csv как dataframe
val pagecount = sqlContext.read.format("csv")
.option("delimiter"," ").option("quote","")
.option("schema","project: string ,article: string ,requests: integer ,bytes_served: long")
.load("dbfs:/databricks-datasets/wikipedia-datasets/data-001/pagecounts/sample/pagecounts-20151124-170000")
Но когда я проверяю схему созданного мной фрейма данных, он, похоже, принял свою схему. Я что-то делаю неправильно? как заставить искра подобрать схему, о которой я упомянул?
> pagecount.printSchema
root
|-- _c0: string (nullable = true)
|-- _c1: string (nullable = true)
|-- _c2: string (nullable = true)
|-- _c3: string (nullable = true)
версию искры вы используете? –