2016-09-30 2 views
0

Я хотел проанализировать файлы excel и узнать диапазон данных (минимальное значение, максимальное значение, min len, max len, пробелы и т. Д. Я хочу создать новый файл анализа, который выплюнул бы эти идеи. ищу в библиотеку панды, чтобы сделать это.Анализ excel с использованием pandas

df = pd.read_excel(open('file.xlsx','rb'), sheetname='TestData') 

Как я должен продолжить?

ответ

0

Вы можете найти некоторые из этих статистических данных, которые вы ищете - min, max, avg (mean), std. отклонение для числовых столбцов, используя метод describe()

Демонстрация:

df = pd.read_excel(r'/path/to/file.xlsx') 

In [35]: df 
Out[35]: 
    a b c txt 
0 8 5 2 dd 
1 6 6 2 aa 
2 3 7 9 cc 
3 4 2 3 dd 
4 3 3 5 cc 

In [36]: df.describe() 
Out[36]: 
       a   b   c 
count 5.000000 5.000000 5.000000 
mean 4.800000 4.600000 4.200000 
std 2.167948 2.073644 2.949576 
min 3.000000 2.000000 2.000000 
25% 3.000000 3.000000 2.000000 
50% 4.000000 5.000000 3.000000 
75% 6.000000 6.000000 5.000000 
max 8.000000 7.000000 9.000000 
Смежные вопросы