2016-09-08 3 views
0

Следующая моя РДД, есть 5 полейКак получить конкретные значения из РДУ в СПАРК с PySpark

[('sachin', 200, 10,4,True), ('Raju', 400, 40,4,True), ('Mike', 100, 50,4,False) ] 

Здесь мне нужно принести 1-й, только 3-й и 5-й Филдс, как это сделать в PySpark. Ожидаемые результаты приведены ниже. Я попытался уменьшитьByKey несколькими способами, не смог достичь этого

Sachin,10,True 
Raju,40,True 
Mike,50,False 

ответ

Смежные вопросы