0
Недавно я написал скрипт python для синтаксического анализа определенной строки с веб-страницы. Этот код работает отлично, но когда я запускаю его, он загружает и записывает файл «.php» на рабочем каталоге:как читать и анализировать html-файл без записи на диск
#!/usr/bin/env python
import wget
import re
from HTMLParser import HTMLParser
import tempfile
url = "http://tuberculist.epfl.ch/quicksearch.php?gene+name=0009&submit=Search#sequence"
filname = wget.download(url)
a = open(filname,'r')
b = a.readlines()
f = "|Rv0009|"
for c in b:
if f in c:
pattern = re.compile("> >.+<br /></")
z = pattern.findall(c)
print z
Какие изменения я должен сделать так, чтобы не писать файл, он будет анализировать нужную строку.
Вы можете использовать модуль 'urllib2' (или модуль [request] (http://requests.readthedocs.org/en/latest/), если он у вас есть), чтобы загрузить содержимое страницы в переменную в памяти. –
@qwrrty Спасибо, что он работает отлично. – user2935002