Я пытаюсь уменьшить RDD с 3 значениями, поэтому, во-первых, я карту ДРР следующего форматаУменьшить операцию на Спарк
a = mytable.rdd.map(lambda w: (w.id,(w.v1,w.v2,w.v3)))
, а затем на следующем шаге я уменьшить его следующим код
b = a.reduceByKey(lambda a,b,c: (a[0] +','+ a[1],b[0] +','+ b[1],c[0] +','+ c[1]))
Однако я получаю сообщение об ошибке, которое: TypeError:() занимает ровно 3 аргумента (2 приведены)
Моя цель состоит в том, чтобы добавить все значения этого РДУ, так, например, если мой рдд, имеющие следующие значения:
[(id1, ('a','b','c')),(id1', ('e','f','g'))]
После снижения я хочу результаты быть в таком порядке:
[(id1, ('a,d','b,e','c,f'))]
Благодаря