Я работаю над проектом анализа данных в Python. У меня есть файл .xls, который мне нужно прочитать и получить определенную информацию из каждой строки. Я использую xlrd.Анализ данных при чтении файла .xls с использованием Python
Когда я открываю файл в блокноте, первые десять строк являются комментариями о том, что содержит файл, а затем я получаю фактические данные. Как пропустить все строки, начинающиеся с «#»?
Кроме того, как только я получаю строки, я хочу перебирать каждую строку и разделять элементы в каждом столбце каждой строки и добавлять ее в словарь для каждого столбца. Как я могу отделить данные в каждой строке на основе столбца?
В настоящее время, вот мой код:
peaksheets = peakfile.sheet_by_name("Sheet1")
num_rows = peaksheets.nrows -1
curr_row = -1
while curr_row < num_rows:
curr_row +=1
row = str(peaksheet.row(curr_row))
words = row.strip().split('\t')
c = words[0]
s = int(words[1])
Я также получаю следующее сообщение об ошибке, когда я запускаю мой код:
xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record; found '# This f'
, поэтому я хочу, чтобы пропустить строки, начинающиеся с символом «#».