2015-02-27 2 views
4

В лаборатории, в которой я работаю, мы обрабатываем множество данных, созданных 96-ритонным планшетным ридером. Я пытаюсь ускорить процесс, написав скрипт, который будет вычислять процентную цитотоксичность от светопоглощения (легкая часть:]) и выводить гистограмму с использованием matplotlib.Как получить данные Excel в массиве с помощью python

Проблема заключается в том, что считывающее устройство для планшета выводит данные в файл .xls. Я понимаю, что некоторые модули, такие как pandas, имеют функцию read_excel, можете ли вы объяснить, как мне следует читать файл excel и помещать его в фреймворк?

Благодаря

образец данных из 24-луночного планшета (для простоты):

0.0868 0.0910 0.0912 0.0929 0.1082 0.1350 
0.0466 0.0499 0.0367 0.0445 0.0480 0.0615 
0.6998 0.8476 0.9605 0.0429 1.1092 0.0644 
0.0970 0.0931 0.1090 0.1002 0.1265 0.1455 
+0

Образец вашего '.xls' файла будет полезно – letsc

+0

Вы также можете посмотреть на' xlrd' модуля - см Http: //www.python-excel. org - но да, 'pandas' будет хорошим выбором, если вы выполняете аналитическую работу/построив данные - я предлагаю начать с документов для [pandas.read_excel] (http://pandas.pydata.org/pandas -docs/dev/сгенерировано/pandas.io.excel.read_excel.html) –

+0

Я редактировал в образце данных с 24 ячейками пластины, для простоты я использую эти данные для проверки кода. – griffinc

ответ

3

Эта задача очень проста в панд в эти дни.

import pandas

df = pandas.read_excel('file_name_here.xlsx', sheet_name='Sheet1')

+1

Спасибо за ваш ответ. Мне пришлось использовать 'sheetname' вместо просто' sheet'. –

4

Я не совсем уверен, что вы имеете в виду, когда вы говорите, массив, но если вы имеете в виду в матрицу, возможно, вы ищете:

import pandas as pd 
df = pd.read_excel([path here]) 
df.as_matrix() 

Это возвращает тип numpy.ndarray.

+0

Да, вот что я имел в виду – griffinc

+0

Итак, учитывая данные, которые вы только что опубликовали, это именно то, что вы ищете. –

1

Существует замечательный пакет xlrd с примером быстрого запуска here. Вы можете просто найти его, чтобы найти фрагменты кода. Я никогда не использовал функцию pandaread_excel, но xlrd покрывает все мои потребности и может предложить еще больше, я считаю.

+0

Я немного слышал об этом, я загляну ему в большее спасибо. – griffinc

+0

'pandas' использует' xlrd' для чтения файлов .xls. –

0

Вы также можете попробовать его с my wrapper library, который использует xlrd, а также:

import pyexcel as pe  # pip install pyexcel 
import pyexcel.ext.xls # pip install pyexcel-xls 
your_matrix = pe.get_array(file_name=path_here) # done 
Смежные вопросы