Ад, привет! Я хочу обходить веб-страницу с помощью python, проблема связана с относительными путями, у меня есть следующие функции, которые нормализуют и делятивизуют URL-адреса на веб-странице, я не могу реализовать одну часть функции свертывания. Есть идеи? :Создание относительных путей абсолюта в python
def normalizeURL(url):
if url.startswith('http')==False:
url = "http://"+url
if url.startswith('http://www.')==False:
url = url[:7]+"www."+url[7:]
return url
def deRelativizePath(url, path):
url = normalizeURL(url)
if path.startswith('http'):
return path
if path.startswith('/')==False:
if url.endswith('/'):
return url+path
else:
return url+"/"+path
else:
#this part is missing
проблема: я не знаю, как получить главный URL, они могут быть в различных форматах:
http://www.example.com
http://www.example.com/
http://www.sub.example.com
http://www.sub.example.com/
http://www.example.com/folder1/file1 #from this I should extract http://www.example.com/ then add path
...
В качестве дополнительной заметки я бы рекомендовал прочитать PEP8, чтобы соответствовать лучшим практикам в стиле кодирования. http://www.python.org/dev/peps/pep-0008/ – msvalkon
Удивительно, большое спасибо за стиль кодирования – torayeff