2016-06-30 3 views
2

Я хочу попробовать и изучить Deep Learning с помощью Python. Первое, что пришло мне в голову для полезного сценария, - это Duplicate-Check.Python Deep Learning find Duplicates

Предположим, у вас есть стол для клиентов с именем, адресом, телефоном, электронной почтой и хотите вставить новых клиентов. т.д .:

In Table: 
Max Test,Teststreet 5, 00642/58458,[email protected] 
To Insert: 
Max Test, NULL, (+49)0064258458, [email protected] 

Это должно быть признано в качестве дубликата записи.

Есть ли уже учебники для этой утилиты? Или это возможно даже при глубоком обучении?

ответ

1

Повторяющееся соответствие - это особый случай соответствия подобия. Вы можете определить функции ввода как отдельные символы или поля, а затем обучить свою сеть. Это проблема двоичной классификации (true/false), если вы не хотите иметь оценку подобия (соответствие 95%). Сеть должна быть в состоянии узнать, что пунктуация и пробелы не имеют значения, а «или функция» - по крайней мере для одного из полей, подходящих для создания истинного положительного.

Звучит как довольно простой случай для глубокого обучения.

Я не знаю какого-либо конкретного учебника для этого, но я попытался дать вам несколько ключевых слов для поиска.

Смежные вопросы