Я использую PySpark.Как разбить столбец векторов на два столбца?
Выход случайного леса Spark ML DataFrame имеет столбец «вероятность», который представляет собой вектор с двумя значениями. Я просто хочу добавить два столбца в выходной DataFrame, «prob1» и «prob2», которые соответствуют первому и второму значениям вектора.
Я попытался следующие:
output2 = output.withColumn('prob1', output.map(lambda r: r['probability'][0]))
, но я получаю ошибку, что «цв должен быть столбец».
Любые предложения о том, как преобразовать столбец векторов в столбцы его значений?
Я попробовал ваше предложение, но он выдает ошибку, аналогичную той, упомянутых здесь: http://stackoverflow.com/questions/29910708/pyspark-py4j-pickleexception-expected-zero-arguments-for- строительство внеклассных – Petrichor