Я использую Spark/Scala, и я хочу заполнить нули в моем DataFrame значениями по умолчанию, основанными на типе столбцов.na.fill in Spark DataFrame Scala
т.е. строковые столбцы -> "строка", числовые столбцы -> 111, булевы Columns -> Ложные и т.д.
В настоящее время DF.na.functions API предоставляет na.fill
fill(valueMap: Map[String, Any])
как
df.na.fill(Map(
"A" -> "unknown",
"B" -> 1.0
))
Для этого требуется знать имена столбцов, а также тип столбцов.
ИЛИ
fill(value: String, cols: Seq[String])
Это только строка/Double типа, даже не Boolean.
Есть ли разумный способ сделать это?
Вы, возможно, потребуется использовать 'isInstanceOf' проверить тип входящего данных и заменить правильное значение. – Shankar
Просьба привести воспроизводимый пример. – mtoto
Спасибо за помощь, я использовал Pattern Matching, чтобы найти тип, nad создал карту и использовал ее –