Есть ли способ сгладить произвольно вложенный Spark Dataframe? Большая часть работы, которую я вижу, написана для конкретной схемы, и я хотел бы иметь возможность обобщать Dataframe с различными вложенными типами (например, StructType, ArrayType, MapType и т. Д.).Сгладить вложенные свечи Dataframe
Скажем, у меня есть схема, как:
StructType(List(StructField(field1,...), StructField(field2,...), ArrayType(StructType(List(StructField(nested_field1,...), StructField(nested_field2,...)),nested_array,...)))
Looking адаптировать это в плоский стол со структурой типа:
field1
field2
nested_array.nested_field1
nested_array.nested_field2
FYI, ищет предложения для Pyspark, но и другие ароматы Искра также оценена.
Что вы подразумеваете под «flatten Dataframe с различными вложенными типами (например, StructType, ArrayType, MapType "? Я не настолько наивна, чтобы ожидать увидеть какой-то код, но может быть полезно как минимум хорошее описание проблемы с примерами. – zero323