У меня есть папка из 1000 CSV-файлов для определенных наборов данных. Для каждого набора данных у меня есть три типа данных. Именования выглядит следующим образом:pythonic style для фильтрации данных в csvs
(предполагается, что имя набора данных 'ааа')
'aaa_values.csv'
'aaa_info.csv'
'aaaps.csv'
Каждый набор данных имеет заголовок различной длины например, «aaa», «ab3fz», «gjt89» и т. д. Обратите внимание, что третий тип данных не имеет подчеркивания, разделяющего тип - это 'ps.csv'
Я хотел бы отфильтровать это, чтобы получить вселенную наборов данных. Мне удалось сделать это со следующим кодом Python, но он неуклюж и не очень «Pythonic».
Есть ли у кого-нибудь предложения для более элегантного способа сделать это?
import os
x = []
y = os.listdir("C:\\Anaconda3\\Python_Library\\Python_Folder\\csvData")
for i in y:
x.append(i.split('_'))
h = []
for i in x:
for j in i:
h.append(j)
c = [l for l in h if l != 'values.csv']
c = list(set([p for p in c if p != 'info.csv']))
[t for t in c if t[-6:]!='ps.csv']