1
Предположим, у меня есть RDD массива [Double], с n столбцами. Я хочу применить фильтр в последнем столбце (скажем, значение> некоторая константа).Применение фильтра на RDD векторов/массива [Double]
- Каков синтаксис этого в Scala/Apache Spark?
- Можно ли сделать то же самое, если бы у меня был RDD векторов?
- Если я могу выбрать один над другим (т. Е. RDD массива [Double] и RDD векторов), какой из них выбрать, чтобы иметь более эффективный/быстрый код?