У меня есть 2 dataFrames и вы хотите их сравнить и вернуть строки из первого (df1), которые не находятся во втором (df2). Я нашел способ сравнить их и вернуть различия, но не могу понять, как вернуть только отсутствующие из df1.Сравнить PandaS DataFrames и вернуть строки, отсутствующие в первом
import pandas as pd
from pandas import Series, DataFrame
df1 = pd.DataFrame({
"City" : ["Chicago", "San Franciso", "Boston"] ,
"State" : ["Illinois", "California", "Massachusett"] })
df2 = pd.DataFrame({
"City" : ["Chicago", "Mmmmiami", "Dallas" , "Omaha"] ,
"State" : ["Illinois", "Florida", "Texas", "Nebraska"] })
df = pd.concat([df1, df2])
df = df.reset_index(drop=True)
df_gpby = df.groupby(list(df.columns))
idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]
blah = df.reindex(idx)
Вы могли бы быть немного более конкретными. В чем вопрос? Где проблема? ... – lrleon