2016-07-18 2 views
1

Предположим, у меня есть dataframe x, содержащий: id, C.Как спрятать Spark dataframes по id?

Предположим, у меня есть dataframe y, содержащий: A, B, id.

Как найти строку в dataframe y, где id является тем же самым и слить все в y.

Результат должен быть:

DataFrame:[A,B,C,id] 

ответ

0
merged = x.join(y, y.id==x.id) 

Используйте капли(), чтобы удалить ненужные столбцы.

1

Как это:

>>> merged = x.join(y, "id") 
Смежные вопросы