2014-07-29 5 views
-2

есть программный способ (желательно на Python), чтобы сохранить исходный код HTML с веб-страницы Internet Explorer в Windows? Я пробовал это с помощью urllib2.urlopen на Python, но у меня ошибка 404. Но я могу открыть ссылку с Internet Explorer без 404. Я думаю, что я могу открыть ссылку в IE с помощью модуля python Webbrowser, но у Webbrowser нет способа сохранить HTML из IE.Программно сохранить HTML из Internet explorer

+0

отправить URL-адрес, который вы пытались сохранить – Sar009

ответ

0
import urllib 
from lxml import html 

url = "http://yourWebsite.com/index.html" 
page = html.fromstring(urllib.urlopen(url).read()) 

Вы пробовали это?

0

Это работает, но опять же я не знаю, какой сайт, если для этого требуется аутентификация, и именно поэтому. Вы не дали подробностей о веб-сайте и о том, что вы пробовали в своем вопросе. Это пример того, как вы можете сохранить html с веб-страницы:

import urllib 

url = 'http://www.google.com' 
lines = urllib.urlopen(url).readlines() 

html = open('google.html', 'w') 
for line in lines: 
    html.write(line) 
Смежные вопросы