Я пытаюсь скрести конкретную таблицу из: this webpagePython + BeautifulSoup: соскоб конкретную таблицу с веб-страницы
То, что я хочу, чтобы скоблить информация запас. Даты, название компании, соотношение и независимо от того, возможно ли это.
Вот что я до сих пор:
from bs4 import BeautifulSoup
import urllib2
url = "http://biz.yahoo.com/c/s.html"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
alltables = soup.find_all('table')
Этот код дает мне все таблицы на странице (Существует более чем один).
1) Я не уверен, как определить таблицу, в которой я нуждаюсь.
2) Я не уверен, как извлечь информацию из этой таблицы в массив или список или какую-либо другую структуру данных, которую я могу использовать для дальнейшего анализа.
Как мы можем знать Ва Вам нужно, если вы сами не знаете? – styvane
Ваша предназначенная таблица является последней таблицей в теге тела. try 'soup.find_all (" table ") [- 1]' – Mortezaipo