1
У меня есть RDD кортежа массива [Int] и хотелось бы узнать, сколько элементов похоже в массиве, что это лучший способ сделать это?Найти число похожих элементов в RDD (Array [Int], Array [Int])
У меня есть RDD кортежа массива [Int] и хотелось бы узнать, сколько элементов похоже в массиве, что это лучший способ сделать это?Найти число похожих элементов в RDD (Array [Int], Array [Int])
Количество общего элемента в массиве является размер множества пересечения:
rdd.map { case (x, y) => x.toSet.intersect(y.toSet).size }
Что вы имеете в виду под «похожи»? –