Очень просто получить простую веб-страницу. Как я могу видеть из python's manumalПолучить весь сайт python
import urllib2
response = urllib2.urlopen('http://python.org/')
html = response.read()
Но как извлечь весь сайт? Может ли кто-нибудь указать мне код?
beautifulsoup - отличный инструмент для этого с помощью функции 'findAll'. +1 – Endophage
Спасибо, я проверю это прямо сейчас. – Bogdan
@Bogdan: Нет проблем, просто имейте в виду, что вы не получили что-то, что вы уже выбрали (вы можете сделать это, просто сохранив страницы на диске относительно их относительного местоположения на сервере - таким образом вы сможете увидеть если файл уже загружен). – Tadeck