У меня есть список, который генерируется функцией. когда я исполню print
в моем списке:Невозможно создать dataframe из списка: pyspark
print preds_labels
я получаю:
[(0.,8.),(0.,13.),(0.,19.),(0.,19.),(0.,19.),(0.,19.),(0.,19.),(0.,20.),(0.,21.),(0.,23.)]
, но когда я хочу, чтобы создать DataFrame
с этой командой:
df = sqlContext.createDataFrame(preds_labels, ["prediction", "label"])
я получаю ошибку сообщение:
не поддерживается тип: тип «numpy.float64»
Если я создаю список вручную, у меня нет никаких проблем. У вас есть идея?
Я ответил на аналогичный вопрос к этому, проверьте [его] (http://stackoverflow.com/ вопросы/38517808/create-a-dataframe-from-a-list-in-pyspark-sql/38517873 # 38517873) out – limbo
спасибо за ваш ответ, он работает –