У меня есть сотни файлов Whois разных доменов верхнего уровня (.com, .se, .uk, .cz и т. Д.). Каждый из них имеет другой формат. Моя основная задача - извлечь информацию, такую как регистратор, регистратор, дата истечения срока действия, обновленная дата и т. Д. Ниже приведен код для com. сеть. org & информация. Я использую Java SE 6.regex извлечение данных
Admin contact: "\\bAdmin\\sEmail:\\s*\\w+\\-*\\w*\\.*\\w*@\\w+(\\.\\w+)+"
Technical contact: "\\bTech\\sEmail:\\s*\\w+\\-*\\w*\\.*\\w*@\\w+(\\.\\w+)+"
Whois Registrant: "\\bRegistrant\\sName:\\s*\\w+\\-*\\.*\\w+\\s*\\w*"
Registrar: "\\bRegistrar:\\w+\\.*\\w*"
Registered on Date: "\\bCreation\\sDate:\\s*\\d+-\\d+-\\d+T\\d+:\\d+:\\d+Z"
Expiry Date: "\\bExpiry\\sDate:\\s*\\d+-\\d+-\\d+T\\d+:\\d+:\\d+Z"
Updated Date: "\\bUpdated\\sDate:\\s*\\d+-\\d+-\\d+T\\d+:\\d+:\\d+Z"
Name Servers: "\\bName\\sServer:\\s*\\w+\\d*\\.*\\w*\\-*\\w*(\\.\\w+)+"
Registrant Status: "\\bDomain\\sStatus:\\s*\\w+"
Как добавить альтернативы для каждой из вышеуказанных точек для других TLD. Например: Я хотел бы иметь серверов имен:
"\\bName\\sServer:\\s*\\w+\\d*\\.*\\w*\\-*\\w*(\\.\\w+)+"
OR
alternative pattern
OR
alternative Pattern
Является ли это выполнимо? Если нет, то есть альтернативный способ?
No. спасибо. Попробуй и вернись. –