мне нужно объединить список в набор из RDD
, но я застрял делать это в Scala:Scala - объединить список для отображения
var accounts = set("name" -> "", "id" -> 0, ....)
//Split the RDD into lines and split each line by `|` to get the values
stream.foreachRDD {_.map(_._2).flatMap(_.split("|")).foreach(f => /*merge here ?*/)}
Как связать значения с моими наборами учетных записей?
Для примера предположим, что RDD загружен из CSV (я сделал эти данные)
Donald|Trump|US|Election|March|Spring|Rubio|Ted Cruz|Ben Carson|Primary|Winner|...
Donald|Trump|US|Election|March|Spring|Rubio|Ted Cruz|Ben Carson|Primary|Winner|...
Donald|Trump|US|Election|March|Spring|Rubio|Ted Cruz|Ben Carson|Primary|Winner|...
Donald|Trump|US|Election|March|Spring|Rubio|Ted Cruz|Ben Carson|Primary|Winner|...
Donald|Trump|US|Election|March|Spring|Rubio|Ted Cruz|Ben Carson|Primary|Winner|...
Donald|Trump|US|Election|March|Spring|Rubio|Ted Cruz|Ben Carson|Primary|Winner|...
Donald|Trump|US|Election|March|Spring|Rubio|Ted Cruz|Ben Carson|Primary|Winner|...
...
ДРР имеет до 300 колонок/полей.
Моя основная цель - преобразовать его в некоторый json, но мне нужно связать каждое значение с ключом, загрузив его в карту или класс.
var election = Map ("firstname" -> "Donald",
"lastname" -> "Trump",
"country" -> "US",
"event" -> "Election",
"period" -> "March"
"var1" -> "Spring",
....
"varN" -> "...")
Я хотел бы помочь вам, но я понятия не имею, что вам нужно. Предоставьте некоторый код с макетными данными и удалите зависимости Spark. Например. «У меня есть этот список <пример списка вставки здесь>, и я хочу преобразовать его в этот набор. Я понятия не имею, какие данные у вас есть, как это отформатировано, что вы получаете, когда вы разделяете от «|» и что вам нужно с этим делать. –
slouc
@slouc - Я просто включил пример, пожалуйста, проверьте его. –