2016-09-15 7 views
0

Таким образом, хотя у меня есть идентичное название, как этот вопрос: PySpark reduceByKey on multiple valuesPySpark reduceByKey с несколькими значениями

Я не могу получить ответ на работу за то, что я хочу сделать.

A = sc.parallelize([("a", (1,0)), ("b", (4,2)),("a", (11,2)), ("b", (4,10))]) 
A.reduceByKey(lambda x, y: x[0]+y[0],x[1]+y[1]).collect() 

дает мне ошибку:

name 'x' is not defined 

Что здесь происходит?

ответ

0

Я нашел проблему. Некоторые круглые скобки:

A.reduceByKey(lambda x, y: (x[0]+y[0] ,x[1]+y[1])).collect() 
Смежные вопросы