Я ищу, чтобы разобрать конкретную страницу Yahoo с использованием скрипта Python (например, взять https://finance.yahoo.com/quote/NOA?ltr=1) и напечатать «Рекомендуемый рейтинг» для файла. Рекомендуемый рейтинг можно найти в правой части страницы примерно на полпути вниз.Учетная запись рекомендуемый рейтинг от Yahoo Stock site
Это то, что я до сих пор
try:
import urllib.request as urllib2
except ImportError:
import urllib2
from bs4 import BeautifulSoup
quote_page = 'https://finance.yahoo.com/quote/NOA?ltr=1'
page = urllib2.urlopen(quote_page)
soup = BeautifulSoup(page, "html.parser")
name_box = soup.find(attrs={'div': 'rating-text Arrow South Fw(b) Bgc($strongBuy) Bdtc($strongBuy)'})
name = name_box.text.strip()
print(name)
Хитрость в том, что я считаю, что рекомендуемый рейтинг только перечислены на странице, как InnerHTML. Я не уверен, как бы я хотел получить данные, толчок в правильном направлении был бы очень признателен!
Что вы пробовали? Вы попробовали [BeautifulSoup] (https://www.crummy.com/software/BeautifulSoup/) в частности? – 9000
Я использовал lxml, вы бы рекомендовали BeautifulSoup? –
У Yahoo нет API? Гораздо надежнее использовать API, чем очищать, поскольку API-интерфейсы предназначены для использования автоматизированными системами, а веб-сайты вообще не являются. Вы могли бы построить отличный скребок и обнаружить, что вы заблокированы Yahoo. – halfer