Можно ли сохранить рамку данных pandas непосредственно в файл паркета? Если нет, то какой будет предлагаемый процесс?Python: сохранить кадр данных pandas в файл паркета
Цель состоит в том, чтобы отправить файл паркета в другую команду, в которой они могут использовать scala-код для чтения/открытия. Благодаря!
Является ли другая команда использованием Spark или других инструментов Scala? Загрузка CSV - это Spark довольно тривиально –
Если у вас есть 'pyspark', вы можете сделать что-то вроде [this] (https://gist.github.com/jiffyclub/905bf5e8bf17ec59ab8f#file-hdf_to_parquet-py) –