В настоящее время я работаю с Apache Spark. Но я не могу понять, как уменьшить работу после того, как карта ..Как уменьшить работу RDD в Apache Spark
мой пример довольно прост
val map = readme.map(line => line.split(" ").size)
я знаю, что это будет возвращать массив количество слов в строке, но где ключ/значение здесь, чтобы передать свертка функции ..
map.reduce((a,b) => {if(a>b) a else b})
уменьшить фазу, как это работает .. (а, б) является tuple_2? или его ключ/значение из функции карты?