Есть ли лучший способ префикса или переименовать все или несколько столбцов одновременно с данным SparkSQL DataFrame
, чем вызов нескольких раз dataFrame.withColumnRenamed()
?Spark DataFrame и переименование нескольких столбцов (Java)
Примером может быть, если я хочу обнаружить изменения (используя полное внешнее соединение). Затем я остаюсь с двумя DataFrame
с той же структурой.
Это больше о Java API и Спарк. В качестве примера 'select' ожидает либо один параметр String, либо varargs или массив' Column ', который не является согласованным, а также иногда немного раздражает. Мне пришлось создать несколько вспомогательных методов для решения этой проблемы, но было бы лучше, если бы эти методы были доступны непосредственно в 'DataFrame'. – JiriS
Существует еще один пример [здесь] (http://stackoverflow.com/questions/32535273/how-to-match-dataframe-column-names-to-scala-case-class-attributes) –
Пробовал ли вы код с помощью Spark 2.0? Я имею дело с 7000 столбцами, см. Https://github.com/ramhiser/datamicroarray/wiki/Golub-(1999). Это требуется навсегда (= никогда не закончилось, пока мое терпение не закончилось). – Boern