Я пишу код в python, который выполняет следующие действия: 1) получает html-файл из Интернета. 2) извлекает свои URL-адреса. 3) сравните эти URL-адреса с ключом поиска и откройте правильную веб-страницу, которую пользователь хочет открыть. Я использую следующий код:Доступ к html-файлу из кэш-памяти
def open_page(name):
try:
links = lxml.html.parse('http://www.w3schools.com/html/').xpath("//a/@href")
for url in links:
if re.search(name, url):
self.get_webpage.open('http://www.w3schools.com/html/'+url)
break
except IndexError as e:
pass`
я должен вызвать этот метод много раз в моем модуле, который делает процесс открытия веб-страницы очень медленно. Я попытался проверить время выполнения каждой строки этого метода и узнал, что lxml.html.parse() потребляет большую часть времени. Также, если я попытаюсь использовать какой-то файл html, который хранится в локальной системе, этот метод работает быстро. Есть ли способ, который мы можем получить html-файл этой веб-страницы http://www.w3schools.com/html/ из кэша после первого раза? стр. Я не хочу постоянно сохранять этот html-файл в своей локальной системе, потому что в этом случае я могу пропустить обновления/изменения в этом html-файле.
Если вы не сохраняете файл на диске, то где будет кеш? Проблема в том, что вы вызываете эту функцию неоднократно, хотя ничего не изменилось большую часть времени? – Taymon
Хорошо, я сожалею, что поставил вопрос неправильно. можете ли вы рассказать мне, как я могу использовать файл с обложкой вместо использования http://www.w3schools.com/html/ внутри lxml.html.parse() – user2460869