Я очень новичок в Spark.Фильтрация записей для всех значений массива в Spark
У меня есть очень простой вопрос. У меня есть массив значений:
listofECtokens: Array[String] = Array(EC-17A5206955089011B, EC-17A5206955089011A)
Я хочу отфильтровать RDD для всех этих значений токена. Я попытался следующим образом:
val ECtokens = for (token <- listofECtokens) rddAll.filter(line => line.contains(token))
Выход:
ECtokens: Unit =()
Я получил пустой блок, даже если есть записи с этими маркерами. Что я делаю не так?
Какая каждая линия RDD? – Marco
Каждая строка в RDD представляет собой строку типа context_type = EC-Token & token = EC-17A5206955089011B –
И что должно содержать ECtokens? Все строки с действующим токеном? или счетчик всех строк с действующим токеном? – Marco