У меня есть цикл в Python, который последовательно импортирует CSV-файлы, назначает их временному объекту DataFrame и затем пытается объединить/конкретизировать их в «master» DataFrame. Код ниже:Параметры слияния для Pandas
for csv_path in csv_paths:
df = pd.read_csv(''+csv_path+'')
df = df.set_index('Player')
if len(MLS_Stats) == 0:
MLS_Stats = pd.concat([MLS_Stats,df])
else:
MLS_Stats = pd.merge(MLS_Stats, df, how="outer",left_index=True,right_index=True)
The MLS_Stats DF изначально пуст, что рассуждение для цикла, если, так как я не думаю, что вы можете объединить DF с пустым DF.
Для каждого слияния я хочу построить DataFrame, включив в него любые новые индексированные строки и новые столбцы, но исключая перекрывающиеся столбцы. Вышеупомянутый код в настоящее время включает перекрывающиеся столбцы с суффиксами _x и _y.
Я знаю, что должно быть что-то, что я не понимаю, потому что это не похоже на необычную ситуацию.
Что ошибка вы получаете? Или проблема, с которой вы сталкиваетесь? –
Он включает перекрывающиеся столбцы ... Мне интересно, если метод comnbine_first - это то, что мне нужно? – ChrisArmstrong
Почему бы не составить список dataframes 'df_list = [df1, df2, df3]', а затем объединить их все в одно и то же время 'MLS_Stats = pd.concat (df_list)'? – Aman