Как преобразовать данные в несколько столбцов Я могу получить RDD [org.apache.spark.sql.Row], но мне нужно что-то, что я мог бы использовать для org. apache.spark.mllib.fpm.FPGrowth, ei RDD [Array [String]] Как конфертировать?scala dataframe to RDD [array [String]]
df.head
org.apache.spark.sql.Row = [blabla,128323,23843,11.23,blabla,null,null,..]
df.printSchema
|-- source: string (nullable = true)
|-- b1: string (nullable = true)
|-- b2: string (nullable = true)
|-- b3: long (nullable = true)
|-- amount: decimal(30,2) (nullable = true)
and so on
Благодаря
Это может быть полезно, если показать нам содержание RDD и ожидаемый результат :) – zero323
Это все еще не имеет смысла. Что именно представляет корзину здесь? – zero323