У меня есть файл xlsx с более чем 1000 столбцами данных. Сначала я хотел бы разобрать каждый второй столбец из файла данных (который может содержать числа и буквы), а затем создать уникальный список из проанализированных данных.Создание уникального списка с использованием Pandas
Я полный noob & попробовал цикл «для» и «сделать пока», но ни один из них не работал для меня.
До сих пор у меня есть:
import pandas as pd
workbook = pd.read_excel('C:\Python27\Scripts\Data.xlsx')
worksheet = workbook.sheetname='Data'
for col in range(worksheet[0], worksheet[1300]):
print(col)
Я думаю, что нужно добавить данные и, возможно, записать в текстовый файл, то создать уникальный список из текстового файла - я могу сделать вторую часть это просто получая это в текстовый файл, с которым у меня возникают проблемы.
Благодаря
Извините, если вы скажете, что каждая вторая колонка означает, что вы имеете в виду только 2-й столбец или каждый столбцы? также вы хотите получить какой-либо глобальный список или список за столбец? Также вы посмотрели ['unique'] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html#pandas.Series.unique)? – EdChum
Спасибо Ed, это каждая четная колонка - 0,2,4,6,8 и т. Д., Или A, C, E, G, I до AWK. Всего 1286 столбцов, поэтому я хотел бы составить список из 643 из них, а затем создать уникальный список из этого списка. Я определенно использую pandas.series.unique(), но я не уверен, как получить 643 столбца в один список. –