1
У меня есть большой файл Excel с большим количеством строк, которые почти идентичны, за исключением одного или двух столбцов. Я приложил образец, чтобы дать вам представление.Укрепить и удалить дубликаты MS excel
Вот пример:
firstname----lastname----phone---address----email
adam--------smith---------123 F st --- [email protected]
adam--------smith-----0256859----123 F st---- [email protected]
adam--------smith---------123 F st---- [email protected]
так, что я хотел бы получить этот
adam----smith---0.123456, 0256859----123 F [email protected], [email protected]
Установите соответствующее программное обеспечение и выполните выполненную работу (например): службы качества данных SQL или KNIME. Если вы хотите сделать это вручную, вам нужно будет сделать довольно причудливое программирование (в зависимости от того, насколько вы хотите его принять): (1) Вы хотите сравнивать столбцы только в том случае, если совпадают имя и фамилия? (2) Как насчет двух разных людей с тем же именем/фамилией? Как их отличить? (3) Вы допускаете сходство имен? например, 'Питер Смит в 123 F st' и' Pete Smith в 123 F st'? Являются ли они одинаковыми (из-за адреса) и похожими названиями? А как насчет Билла и Уильяма? – Ralph