Я использую регулярное выражение, чтобы найти имя хоста в строке, которая соответствует всем возможным комбинациям, но не может ее построить.Regex, чтобы найти имя хоста в строке
names = ['www.google.com.in','w.stack.in','www.code31ws.com','google.com','ww.sample.co']
regex = '(w{3}?\.?)?[\w?-]+\.(com|in|edu|co)'
for i in range(len(ips)):
reg = re.search(regex,ips[i])
if reg:
print "true {}".format(i)
else:
print "false {}".format(i)
Результат его:
true 0
true 1
true 2
true 3
true 4
Хочет, что он не должен соответствовать:
w.stack.in
ww.sample.com
Обратите внимание, что 'w.stack.in' и' ww.sample.com' являются допустимыми именами хостов. – sowa
Рассмотрите библиотеку 'urlparse'. –
[w.stack.in] (http://w.stack.in/) - это даже фактический веб-сайт. –