ребята У меня есть проблема с комбинациями методовСпарк метод Scala комбинаций
Мой код:
val myRDD = sc.parallelize(Seq("aaa bbb bbb"))
myRDD: org.apache.spark.rdd.RDD[String] = ParallelCollectionRDD[0] at parallelize at <console>:27
scala> myRDD.foreach{println}
aaa bbb bbb
scala> myRDD.map(_.split(" ")).flatMap(_.combinations(2)).
| map(p=>(p.mkString(","),1)).
| reduceByKey(_+_).
| foreach{println}
(aaa,bbb,1)
(bbb,bbb,1)
Я не», почему выход не
(aaa,bbb,2)
(bbb,aaa,2)
(bbb,bbb,1)