Я пытаюсь использовать панды для присоединения контента из трех отдельных плоских файлов в один .csv. Одно из полей вывода, «StoreID», основано на отдельном списке значений ID («Stores.txt»). По сути, мне нужно опубликовать объединенную фреймворк в виде серии строк csv и одновременно добавить результаты для каждого идентификатора магазина в третьем столбце. У меня возникают проблемы с синтаксисом итерации. Любая помощь была бы очень признательна!Append Py Pandas Dataframes в один .csv, итерация отдельным списком
import pandas as pd
items = pd.read_csv("Item_List.csv")
store_loc = pd.read_csv("Store_Locations.csv")
stores = open("Stores.txt")
for i in stores:
item_merged = items.merge(store_loc, on='itemCat')
item_merged['storeID'] = i
item_merged.to_csv("stores_items_output.csv", index=False)
Гипотетический Stores.txt:
3
5
6
Желаемая выход, данный объединенный список пунктов и мест:
itemID,storeLocation,StoreID
12345,ABCDE,3
23456,ABCDE,3
34567,BCDEF,3
12345,ABCDE,5
23456,ABCDE,5
34567,BCDEF,5
12345,ABCDE,6
23456,ABCDE,6
34567,BCDEF,6
похоже, что вы пытаетесь дублировать комбинированные dfs itemID и storeLocation с каждым StoreID, правильно? было бы лучше конкатенировать их, но установить «StoreID» до конкатенации, в тот момент, когда вы переписываете каждое слияние с последней заданной операцией, так что все ваши строки будут иметь один и тот же «storeID». Я бы просто создал temp df или intial merge, установил столбец «storeID», а затем либо слиял, либо concat с вашим item_merged 'df. – EdChum