Я пытаюсь получить максимальное значение Алфавит из блока данных панды в целом. Меня не интересует, в какой строке или столбце она появилась. Меня интересует только одно максимальное значение в пределах кадра данных.Как найти максимальное значение Алфавит из DataFrame apache spark?
Это то, что он выглядит следующим образом:
id conditionName
1 C
2 b
3 A
4 A
5 A
ожидаемый результат:
|id|conditionName|
+--+-------------+
| 3| A |
| 4| A |
| 5| A |
+----------------+
, потому что 'A' является первой буквой алфавита
df= df.withColumn("conditionName", col("conditionName").cast("String")) .groupBy("id,conditionName").max("conditionName"); df.show(false);
Exception : "conditionName" не является числовым столбцом. Функция агрегирования может применяться только к числовому столбцу;
Мне нужен максимум от всего кадра данных алфавита. Что следует использовать, чтобы добиться желаемых результатов?
Благодарим заранее!
что ожидается выход ? и каково ваше определение «максимального значения от алфавита» ' – mtoto
Простите, я отредактирую его, Спасибо за напомню! –
все еще неясно, почему, потому что '' A ''является первой буквой алфавита или потому, что имеет наибольший счет? – mtoto