Предположим, что у меня есть пара значений ключей в Spark, например следующее.Как уменьшить пару ключевых значений до ключа и списка значений?
[ (Key1, Value1), (Key1, Value2), (Key1, Vaue3), (Key2, Value4), (Key2, Value5) ]
Теперь я хочу уменьшить это, к чему-то подобному.
[ (Key1, [Value1, Value2, Value3]), (Key2, [Value4, Value5]) ]
То есть, от Key-Value до Key-List of Values.
Как это сделать, используя карту и уменьшать функции в python или scala?
Итак, вы хотите решение Spark в Scala или Python или в простой Scala | Решение Python? другими словами, ваша стартовая коллекция RDD? – maasg
Возможная дубликация [Уменьшить пару «ключ-значение» в парном списке с Apache Spark] (http://stackoverflow.com/questions/27002161/reduce-a-key-value-pair-into-a-key- list-pair-with-apache-spark) –