У меня есть дела класс вроде этого:Spark .csv viariable число столбцов
case class ResultDays (name: String, number: Double, values: Double*)
, и я хочу сохранить его в файл .csv
resultRDD.toDF()
.coalesce(1)
.write.format("com.databricks.spark.csv")
.option("header", "true")
.save("res/output/result.csv")
К сожалению, у меня есть эта ошибка:
java.lang.UnsupportedOperationException: CSV data source does not support array<double> data type.
Итак, как я могу вставить переменное число values
и сохранить его в .csv
?
CSV, как _format_, не поддерживает переменное количество значений, в том смысле, что все записи должны иметь одинаковые столбцы. Вы знаете что-нибудь о количестве ожидаемых значений? Может быть, _maximum_ количество значений, которые может иметь член 'values'? –
Я должен написать одно и то же число «значений» для каждой строки, но я не знаю, сколько «значений» у меня есть перед запуском. –
OK - но как только у вас есть 'resultRDD', вы можете предположить, что все записи имеют одинаковое количество значений? –