2014-09-01 4 views
-1

У меня есть сотни файлов Whois разных доменов верхнего уровня (.com, .se, .uk, .cz и т. Д.). Каждый из них имеет другой формат. Моя основная задача - извлечь информацию, такую ​​как регистратор, регистратор, дата истечения срока действия, обновленная дата и т. Д. Ниже приведен код для com. сеть. org & информация. Я использую Java SE 6.regex извлечение данных

Admin contact: "\\bAdmin\\sEmail:\\s*\\w+\\-*\\w*\\.*\\w*@\\w+(\\.\\w+)+" 
    Technical contact: "\\bTech\\sEmail:\\s*\\w+\\-*\\w*\\.*\\w*@\\w+(\\.\\w+)+" 
    Whois Registrant: "\\bRegistrant\\sName:\\s*\\w+\\-*\\.*\\w+\\s*\\w*" 
    Registrar: "\\bRegistrar:\\w+\\.*\\w*" 
    Registered on Date: "\\bCreation\\sDate:\\s*\\d+-\\d+-\\d+T\\d+:\\d+:\\d+Z" 
    Expiry Date: "\\bExpiry\\sDate:\\s*\\d+-\\d+-\\d+T\\d+:\\d+:\\d+Z" 
    Updated Date: "\\bUpdated\\sDate:\\s*\\d+-\\d+-\\d+T\\d+:\\d+:\\d+Z" 
    Name Servers: "\\bName\\sServer:\\s*\\w+\\d*\\.*\\w*\\-*\\w*(\\.\\w+)+" 
    Registrant Status: "\\bDomain\\sStatus:\\s*\\w+" 

Как добавить альтернативы для каждой из вышеуказанных точек для других TLD. Например: Я хотел бы иметь серверов имен:

"\\bName\\sServer:\\s*\\w+\\d*\\.*\\w*\\-*\\w*(\\.\\w+)+" 
OR 
alternative pattern 
OR 
alternative Pattern 

Является ли это выполнимо? Если нет, то есть альтернативный способ?

+0

No. спасибо. Попробуй и вернись. –

ответ

1

Альтернативные модели могут быть объединены с оператором |:

"\\bName\\sServer:\\s*\\w+\\d*\\.*\\w*\\-*\\w*(\\.\\w+)+|alternative pattern|alternative Pattern" 

(. Если это не то, что вам нужно, то ваш вопрос следует переформулировать)

+0

Спасибо за подсказку !!! –

Смежные вопросы