Я хотел бы прочитать некоторые из информации с этого сайта: http://www.federalreserve.gov/monetarypolicy/beigebook/beigebook201301.htmКак читать текст с веб-сайта в Python
У меня есть следующий код, и он правильно читает по источникам HTML
def Connect2Web():
aResp = urllib2.urlopen("http://www.federalreserve.gov/monetarypolicy/" +
"beigebook/beigebook201301.htm")
web_pg = aResp.read()
print web_pg
Однако я теряюсь на том, как анализировать эту информацию, потому что для большинства парсеров HTML требуется файл или исходный веб-сайт, тогда как у меня уже есть информация, которая мне нужна в String.
«Для большинства парсеров HTML требуется файл или оригинальный веб-сайт« False. Большинство из них работают просто по HTML. –
Посмотрите на [Красивый суп] (http://www.crummy.com/software/BeautifulSoup/). –