Я работаю над проектом, связанным с фильтрацией спама. Многие из вас могут знать об этой технике, используемой спамерами:коллекция вариантов слов с использованием специальных символов
- письма «элементы», как «| ТЭМ» (труба вместо I)
- $ эля вместо продажи
- h0t вместо горячей (ноль вместо буквы «о»)
и т.д. и т.п.
мне интересно, если есть для всех таких возможных вариантов слов с использованием специальных символов базы данных? Или кто-нибудь знает о какой-то хорошей стратегии для решения этой трюки?
В настоящее время, что я сделал, я просто заменяю '@' на 'a', '|' с 'i', '$' с 's' и так далее. Мне нужно ваше мнение по этому вопросу! Пожалуйста помоги.
Присылайте любые идеи и предложения, которые у вас есть в голове, прежде чем голосовать, чтобы закрыть вопросы :(! – kunal18