В python pandas.describe(includes='all'),
категориальные атрибуты показывают только «count, unique, top и freq», где вы не знаете «null, count of a категориальные значения». Например, у меня есть переменная «секс», где она не показывает, сколько мужчин/женщин существует или НС. Но в R summary()
выполнит задания как для чисел, так и для категориальных переменных. Как вы можете достичь стиля R summary()
в python. Кстати, выход includes='all'
варианта не совсем удобный для пользователя по сравнению с RR стиль категориальной описательной статистики в python
1
A
ответ
2
Рассмотрит создание определенного пользователя списка сводных один для цифровых и других для категориальных (т.е. объектов типов) столбцов для тиражирования итогового результата R. Даже удалите if
в понимании списка, чтобы возвращать подсчеты для всех столбцов. Ниже использует Titanic набор данных из @ vincentarelbundock'S R datasets page:.
df = pd.read_csv('https://vincentarelbundock.github.io/Rdatasets/csv/datasets/Titanic.csv',
index_col=0)
summary_list = [df.describe()] + \
[df.groupby([c])[df.columns[0]].count() \
for c in df.columns if df[c].dtype == 'object']
for i in summary_list:
print(i)
print()
Выход
Age Survived SexCode
count 756.000000 1313.000000 1313.000000
mean 30.397989 0.342727 0.351866
std 14.259049 0.474802 0.477734
min 0.170000 0.000000 0.000000
25% 21.000000 0.000000 0.000000
50% 28.000000 0.000000 0.000000
75% 39.000000 1.000000 1.000000
max 71.000000 1.000000 1.000000
Name
Abbing, Mr Anthony 1
Abbott, Master Eugene Joseph 1
Abbott, Mr Rossmore Edward 1
Abbott, Mrs Stanton (Rosa) 1
Abelseth, Miss Anna Karen 1
Abelseth, Mr Olaus 1
Abelson, Mr Samuel 1
Abelson, Mrs Samuel (Anna) 1
Abraham, Mrs Joseph (Sophie Easu) 1
Abrahamsson, Mr August 1
Adahl, Mr Mauritz Nils Martin 1
Adams, Mr John 1
Ahlin, Mrs Johanna Persdotter 1
Ahmed, Mr Ali 1
Aijo-Nirva, Mr Isak 1
Aks, Master Philip 1
Aks, Mrs Sam (Leah Rosen) 1
Aldworth, Mr Charles Augustus 1
Alexander, Mr William 1
Alhomaki, Mr Ilmari Rudolf 1
Ali, Mr William 1
Allen, Miss Elisabeth Walton 1
Allen, Mr William Henry 1
Allison, Master Hudson Trevor 1
Allison, Miss Helen Loraine 1
Allison, Mr Hudson Joshua Creighton 1
Allison, Mrs Hudson JC (Bessie Waldo Daniels) 1
Allum, Mr Owen George 1
Andersen, Mr Albert Karvin 1
Andersen, Mr Thor Olsvigen 1
..
Williams, Mr Charles Duane 1
Williams, Mr Charles Eugene 1
Williams, Mr Fletcher Lambert 1
Williams, Mr Howard Hugh 1
Williams, Mr Leslie 1
Williams, Mr Richard Norris II 1
Wilson, Ms Helen 1
Windelov, Mr Einar 1
Wirz, Mr Albert 1
Wiseman, Mr Phillippe 1
Wittevrongel, Mr Camiel 1
Woolner, Mr Hugh 1
Wright, Miss Marion 1
Wright, Mr George 1
Yalsevac, Mr Ivan 1
Yasbeck, Mr Antoni 1
Yasbeck, Mrs Antoni 1
Young, Miss Marie Grice 1
Youssef, Mr Gerios 1
Yrois, Miss Henriette 1
Zabour, Miss Hileni 1
Zabour, Miss Tamini 1
Zakarian, Mr Artun 1
Zakarian, Mr Maprieder 1
Zenni, Mr Philip 1
Zimmerman, Leo 1
de Brito, Mr Jose Joaquim 1
de Villiers, Madame Berthe 1
del Carlo, Mr Sebastiano 1
del Carlo, Mrs Sebastiano (Argenia Genovese) 1
Name: Name, dtype: int64
PClass
* 1
1st 322
2nd 279
3rd 711
Name: Name, dtype: int64
Sex
female 462
male 851
Name: Name, dtype: int64
Смежные вопросы
- 1. Экспорт описательной статистики строк значений в лист Excel из R
- 2. Совокупные столбцы в data.table для описательной статистики
- 3. категориальной переменной даты в R
- 4. описательной статистики «TimeSeries» структуры данных с использованием пакета в R психологическую
- 5. Вычисление описательной статистики с MySQL без оператора GROUP BY
- 6. Использование ddply для множества переменных при вычислении описательной статистики
- 7. Хороший способ просмотра/печати описательной статистики большого набора данных в python?
- 8. Запуск статистики в R
- 9. У R есть NCSS-стиль «Описательная статистика» или другие отчеты?
- 10. Консоль статистики R в QT
- 11. новые данные в R статистики
- 12. прокладочные порядковые статистики в R
- 13. управление запасами прецеденты описательной
- 14. Петля в SPSS для повторного рисования образца и получения описательной статистики по каждому образцу
- 15. Преобразование категориальной переменной в переменную счетчика событий в R
- 16. Улучшение расчетов статистики QCC в R
- 17. R: Циклический суммарные статистики в сводной таблицу
- 18. Как импортировать данные статистики (* .sta) в R
- 19. Табулирование dataframe в R с суммарной статистики
- 20. Вычислить хи-квадрат статистики в R
- 21. Отображение статистики в таблице с использованием R
- 22. Markdown в других пакетах статистики, чем R
- 23. Добавление таблицы статистики к boxplot в R
- 24. t.test из итоговой статистики в R?
- 25. 3D участок с категориальной оси [Python/Matplotlib]
- 26. Стиль-стиль в стиле Python для C#?
- 27. фиктивные переменные к одной категориальной переменной (множителю) в R
- 28. Как получить самый частый уровень категориальной переменной в R
- 29. Переименование категориальной переменной, основываясь на значениях другой переменной в R
- 30. Использование функции ifelse в R для пересчета уровней категориальной переменной
Используйте 'ДФ [ 'Sex'] value_counts()' как быстрый и грязный заменителя. – DyZ