2015-08-03 20 views
0

У меня есть две папки, содержащие файлы +50 .csv, я хочу обрабатывать эти файлы в моем коде python с помощью pandas. В начале моего кода я загрузить два различных .csv файлы:Loop over multiple .csv files python/pandas

Location1 = path\tasks_01.csv'   
Location2 = path\resource_01.csv'   

dftask = pd.read_csv(Location1) 
dfresource = pd.read_csv(Location2) 

В середине я делаю все виды различных операций для структурирования данных и т.д. В конце концов, я сохранить как .csv файлы на новый. CSV-файл:

dftask.to_csv(path\tasks_new.csv') 
dfresource.to_csv(path\resource_new.csv') 

Поскольку у меня есть две папки, одна containts в task.csv файлов, а другие в resource.csv файлы, как я могу изменить код таким образом сможем перебирают все эти файлы? И сохранить их под своим первоначальным именем?

Надеюсь, вы можете мне помочь!

ответ

0

Создайте список файлов в каждой папке, а затем запишите их оба.

import os 

files_in_folder_1 = [os.path.join(path1, f) for f in os.listdir(path1) if os.path.isfile(os.path.join(path1, f))] 

files_in_folder_2 = [os.path.join(path2, f) for f in os.listdir(path2) if os.path.isfile(os.path.join(path2, f))] 

for file1, file2 in zip(files_in_folder_1, files_in_folder_2): 
    with open(file1) as f1, open(file2) as f2: 
     ... 
+0

Вы можете более подробно объяснить, как я должен это делать? – F1990

+0

Я отправил свой ответ слишком быстро, добавил дополнительную информацию. – DeepSpace

+0

Oke;) Но можете ли вы также показать, как я должен редактировать dftask и dfresource, dataframes? Или f1 = location1 и f2 = location2? И как мне изменить последнюю строку кода для сохранения файлов? – F1990