2
Я хотел бы преобразовать pyspark.sql.dataframe.DataFrame
в pyspark.rdd.RDD[String]
pyspark: Преобразование DataFrame в РДУ [строка]
Я преобразовал DataFrame df
в РДУ data
:
data = df.rdd
type (data)
## pyspark.rdd.RDD
новый РДУ data
содержит
first = data.first()
type(first)
## pyspark.sql.types.Row
data.first()
Row(_c0=u'aaa', _c1=u'bbb', _c2=u'ccc', _c3=u'ddd')
Я бы хотел (а) конвертировать в список из String
, как пример ниже:
u'aaa',u'bbb',u'ccc',u'ddd'
Благодарности
Спасибо @ zero323 с вашими ответами моя кривая обучения будет лучше – Toren