Привет, У меня есть код, который просто получает количество слов из документа. Мне также нужно использовать карту для поиска значения данных перед генерированием вывода. Вот код.reduceByKey не является членом
requests
.filter(_.description.exists(_.length > 0))
.flatMap { case request =>
broadcastDataMap.value.get(request.requestId).map {
data =>
val text = Seq(
data.name,
data.taxonym,
data.pluralTaxonym,
request.description.get
).mkString(" ")
getWordCountsInDocument(text).map { case (word, count) =>
(word, Map(request.requestId -> count))
}
}
}
.reduceByKey(mergeMap)
Сообщение об ошибке
reduceByKey is not a member of org.apache.spark.rdd.RDD[scala.collection.immutable.Map[String,scala.collection.immutable.Map[Int,Int]]]
Как я могу решить эту проблему? Мне нужно вызвать getWordCountsInDocument. Благодаря!
вам нужно получить PairRDD. Попробуйте использовать .map() перед reduceByKey – Natalia