2016-10-03 1 views
0

В scala у меня есть Список [String], который я хочу добавить в качестве нового столбца в существующий DataFrame.Добавить новый столбец с его данными в существующий DataFrame с помощью

Оригинал DF:

Name | Date 
======|=========== 
Rohan | 2007-12-21 
... | ... 
... | ... 

Пусть требуется добавить новый столбец отдела

Прогнозный DF:

Name | Date  | Department 
=====|============|============ 
Rohan| 2007-12-21 | Comp 
... | ...  | ... 
... | ...  | ... 

Как я могу сделать это в Scala?

+0

Есть ли какое-либо отношение между столбцами? Любые правила? – eliasah

+0

Итак, вы хотите присоединиться к ним? Я не думаю, что вы просто хотите добавить некоторые случайные значения. – Reactormonk

+0

Probaly вы хотите присоединиться к своему df по имени с другим df. – gasparms

ответ

1

Вы можете сделать это одним способом, как просто создать dataframe имени и listvalues ​​и присоединиться как dataframe с колонкой именем

1

Это решило мою проблему

val newrows = dataset.rdd.zipWithIndex.map(_.swap) 
     .join(spark.sparkContext.parallelize(results).zipWithIndex.map(_.swap)) 
     .values 
     .map { case (row: Row, x: String) => Row.fromSeq(row.toSeq :+ x) } 

Тем не менее нужны точные объяснения этого ,

Смежные вопросы