Я хочу рассчитать частотное распределение (вернуть наиболее общий элемент в каждом столбце и количество раз, когда оно появилось) в кадре данных с использованием искры и scala. Я пробовал использовать библиотеку DataFrameStatFunctions, но после того, как я отфильтровал свою фреймворк только для столбцов с числовым типом, я не могу использовать любые функции из библиотеки. Лучший способ сделать это для создания UDF?Ищете способ вычисления частотного распределения кадра данных в искровой/scala
0
A
ответ
6
вы можете использовать val newDF = df.groupBy("columnName").count() newDF.show()
он покажет вам количество частот для уникальных записей.
Смежные вопросы
- 1. Ищете эффективный способ вычисления дисперсий многомерного распределения в R
- 2. Применение для цикла в R для вычисления частотного распределения
- 3. Расчет частотного распределения коллекции с .Net/C#
- 4. Поиск частотного распределения списка чисел в python
- 5. Вычисление частотного распределения для вектора ints
- 6. Лучший способ вычисления значений для строк кадра данных
- 7. Ищете лучший способ визуализации распределения в R и ggplot2
- 8. Ищете лучший способ сортировки данных
- 9. Ищете лучший способ построения данных
- 10. Создать функцию для вычисления Rcorr на подмножествах кадра данных
- 11. Использование частотного набора данных в python
- 12. Python: простой способ создания worldmap распределения данных
- 13. Генерации нового dataframe после вычисления старого кадра данных
- 14. Расширение частотного набора данных для одной переменной
- 15. Каков наилучший способ сократить время вычисления при обработке большого кадра данных?
- 16. Ищете способ перевода приложения
- 17. Ищете более быстрый способ сделать вычисления для различного количества строк в разных факторах в data.frame
- 18. Самый чистый способ фильтрации кадра данных Pandas?
- 19. Каков наилучший способ избежать передачи кадра данных?
- 20. Ищете эффективный способ индексирования файлов
- 21. Ищете способ представления данных в текстовом файле в виде графика
- 22. Способ вычисления больших списков
- 23. Заголовок кадра данных в R
- 24. R: Заставить подмножество кадра данных оставаться в качестве кадра данных
- 25. Создание гистограммы распределения и затем вычисления zscore в R
- 26. вычисления функции риски в R для стандартного нормального распределения
- 27. Правильный способ вычисления процентиля
- 28. Индексирование кадра данных
- 29. Ищете удобный способ вставки области данных ячейки Excel в MySQL
- 30. Ищете способ добавления данных в проверку валидации исключения