Я использую listadmin для управления многочисленными почтовыми списками на основе mailman. У меня длинный список тем и адресов, настроенных для блокировки спама. В последнее время я получил умнее спам в том смысле, что он использует симпатичные символы Unicode, например:Perl: Как совместить FULLWIDTH LATIN SMALL
Subject: Al л объявление щий мы х лет вы»ве не видит NARE ничего гр ompari- нг наших ехй xci ti ng компиляция 13 000 модов в HD t шляпа av avable для y ou сейчас!
или
Тема: HD ква горит у VI d Eos зве фо графу с о е хо TC HIC кс
здесь для и
Теперь я хочу используйте интеллектуальное регулярное выражение Perl, чтобы заблокировать это. Трубопроводы этих предметов в hexdump показали, что многие символы - это FULLWIDTH LATIN SMALL LETTER. Однако \p{FULLWIDTH LATIN SMALL LETTER}
не работает: Can't find Unicode property definition "FULLWIDTH LATIN SMALL LETTER"
Вопрос: Есть ли \p{something}
в соответствии с этими символами полной ширины? Альтернативно: есть ли другой способ сопоставить эти символы?
большое спасибо @ikegami для просветительского редактирования и развлекательного модуля он связан с. – amon
Это один из tchrist's. 'unichars' может использоваться для обращения. например 'unichars -au '\ p {InHalfwidthAndFullwidthForms}' 'перечисляет символы в блоке HalfwidthAndFullwidthForms. – ikegami