dataFrame.select(columnName).filter(myFunction(_));
Мне нужно отфильтровать только те записи, которые возвращают true для «myFunction»; myFunction принимает значение столбца для каждой записи и выполняет некоторый анализ значения и возвращает true или false.Spark Scala Dataframes: Фильтровать записи, которые возвращают false для функции
Что я хочу достичь, это отфильтровать значения, которые нельзя отнести к числовым данным (скажем, double). У меня есть столбец, который содержит в основном числовые данные и несколько строковых данных. Я хочу отфильтровать те значения, которые нельзя перевести в двойные.
А что именно не работает Wi какой код вы используете? Каков ваш реальный вопрос? –
вам понадобится карта на вашей функции. фильтр просто возьмет запись, где условие, возвращаемое myFunction, истинно – eliasah