Если предположить, что у меня есть следующий RDD:Добавить увеличивающиеся переменную в РДУ
test1 = (('trial1',[1,2]),('trial2',[3,4]))
test1RDD = sc.parallelize(test1)
Как я могу создать следующий RDD:
((1,'trial1',[1,2]),(2,'trial2',[3,4]))
Я попытался с аккумуляторами, но он не работает, как аккумуляторы не могут быть доступный в задачах:
def increm(keyvalue):
global acc
acc +=1
return (acc.value,keyvalue[0],keyvalue[1])
acc = sc.accumulator(0)
test1RDD.map(lambda x: increm(x)).collect()
Любая идея, как это можно сделать?