Я пытаюсь заполнить недостающие значения в блоке данных искры с помощью PySpark. Но нет подходящего способа сделать это. Моя задача - заполнить недостающие значения некоторых строк относительно их предыдущих или следующих строк. Конкретно, я бы изменил значение 0.0 одной строки на значение предыдущей строки, ничего не делая в ничтожной строке. Я видел функцию Window в искры, но она поддерживает только простую операцию типа max, min, mean, которая не подходит для моего случая. Было бы оптимально, если бы у нас могла быть определенная пользователем функция, скользящая по данному окну. У кого-нибудь есть хорошая идея?Заполните пропущенное значение в Spark dataframe
2
A
ответ
1
Используйте Spark window API для доступа к данным предыдущих строк. Если вы работаете с данными временных рядов, см. Также this package за missing data imputation
.
+1
@wayag Если ответ работает на вас, примите ответ :) –
Смежные вопросы
- 1. Spark Scala - Обработка пустой DataFrame
- 2. Заменить пропущенное значение макросом
- 3. SPARK DataFrame: Удалить значение MAX в группе
- 4. SumProduct в Spark DataFrame
- 5. Spark DataFrame
- 6. Заполните пропущенные даты в dataframe, используя среднее значение
- 7. Свернуть a Spark DataFrame
- 8. Spark DataFrame zipWithIndex
- 9. Пропущенное значение обрабатывается как пустое в CFQUERYPARAM
- 10. Найти последнее не пропущенное значение в векторе
- 11. Pandas Dataframe: Заполните пропущенные месяцы
- 12. Как расплавить Spark DataFrame?
- 13. Spark Implicit $ for DataFrame
- 14. Как развернуть Spark DataFrame?
- 15. Spark Dataframe parallel read
- 16. Преобразование DataFrame Spark Scala
- 17. Spark DataFrame vs sqlContext
- 18. Агрегация данных DataFrame Spark
- 19. Преобразование Spark Dataframe Column
- 20. Spark DataFrame и Cassandra
- 21. CaseWhen in spark DataFrame
- 22. Spark DataFrame mapPartitions
- 23. spark dataframe - GroupBy aggregation
- 24. Spark DataFrame AnalysisException
- 25. Ошибка карты Spark DataFrame
- 26. Как разрешить None значение приниматься в dataframe в Spark 2?
- 27. Spark - Создание вложенных DataFrame
- 28. Дублирующие столбцы в Spark Dataframe
- 29. Равенство DataFrame в Apache Spark
- 30. Spark: Преобразование типов в DataFrame
Пожалуйста, поделитесь примерами данных, кодом, который вы пробовали и ожидали вывода. – mtoto
Как вы бы описали "предыдущая строка"? Любая сортировка? –