0
У меня есть 2 файла (.csv и .xls). . CSV имеют только один столбец (e-mail). . Xls имеют много столбцов. Я пытаюсь сравнить столбцы электронной почты в этих двух файлах и удалить из почтового адреса .xls не в .csv. Адрес электронной почты не сортируется.Panda сравнить и удалить данные из csv и xls
меня написать код, но я не достиг своей цели:
excel = pd.read_excel(file, skiprow=10, parse_cols = 'AL')
csv = pd.read_csv(namelist_file)
excel_keep = excel[excel.isin(csv)]
mask = excel.isin(csv.tolist())
excel[~mask]
print(excel_keep)
У вас идею, пожалуйста? С уважением.
Хорошо, что выбрать только то, что я хочу поблагодарить вас очень много. – Oyabi
Как удалить все строки, которые не содержат адрес электронной почты из csv? – Oyabi
Если они являются нулями внутри, вы можете df = df [df ['email']. Isnull() == False], надеюсь, что это поможет, если проблема решена PLS отметить правильный ответ :) – epattaro