Файл паркета для преобразования CSV

Я хочу преобразовать файл Parquet в CSV. Есть ли способ для того же, что и я могу найти CSV в файле Parquet, а не наоборот.Файл паркета для преобразования CSV

источник

2015-10-06 Ric Da

Вы используете искры? Если, пожалуйста, используйте хорошие теги (apache-spark). – mauriciojost

Не могли бы вы представить пример кода того, что вы хотели бы иметь? – mauriciojost

См. Http://stackoverflow.com/questions/39419975/how-to-copy-and-convert-parquet-files-to-csv –

DataFrame df = sqlContext.parquetFile("parquet path"); 


    df.javaRDD().saveAsTextFile("outputpath");

источник

2015-10-15 17:46:26 indicoder

Это работало для меня при использовании искры 2.1.0. Первый запуск искровой оболочки. Что-то вроде:

./bin/spark-shell

затем:

val sqlContext = new org.apache.spark.sql.SQLContext(sc) 
val df = sqlContext.parquetFile("parquet-file.parquet") 
df.printSchema() 
df.write.format("csv").save("directory")

будет создавать CSV-файлы в directory

источник

2017-04-18 20:59:21 morpheus

Это будет просто используя искру и Python:

for filename in glob.glob("[location_of_parquet_file]/*.snappy.parquet"): 
     print filename 
     df = sqlContext.read.parquet(filename) 
     df.write.csv("[destination]") 
     print "csv generated"

источник

2017-09-04 14:59:49

Это работало меня в искры

spark-shell --packages com.databricks:spark-csv_2.11:1.2.0 
val df = sqlContext.parquetFile("/hdfs/source.parquet") 
df.printSchema() 
df.write.format("com.databricks.spark.csv").save("/hdfs/target_csv")

источник

2018-01-24 11:07:30

Файл паркета для преобразования CSV

ответ

Смежные вопросы