После вопроса, который я разместил здесь:Спарк Scala - Сплит столбцы в несколько строк
Я еще одно сомнение ... Есть возможность превратить набор данных, как это:
2,1,3
1
3,6,8
в это:
2,1
2,3
1,3
1
3,6
3,8
6,8
в основном я хочу, чтобы открыть все отн отношения между фильмами. Можно это сделать?
Мой текущий код:
val input = sc.textFile("PATH")
val raw = input.lines.map(_.split(",")).toArray
val twoElementArrays = raw.flatMap(_.combinations(2))
val result = twoElementArrays ++ raw.filter(_.length == 1)
Привет Томаш Blachut, большое спасибо !!! Я получаю ошибку, когда я подаю необработанную переменную ... Я обновляю код, который я использую. Ошибка: error: строки значений не является членом org.apache.spark.rdd.RDD [String] – SaCvP
@PedroRodgers Ну да, я написал, что ввод представляет собой многострочную строку, а не RDD линий. Я обновляю ответ с помощью решения, закодированного вручную, но у меня нет Spark на этой машине, чтобы проверить его. –
Не волнуйтесь, я просто удаляю .lines, и это работает;) – SaCvP