2014-01-23 6 views
-1

Я пытаюсь получить информацию о таблицах в this html кадрах. Я имею в виду таблицы, имеющие столбцы:получить данные из фреймов html

Year,Month,Oil Production m3,Gas Production Ksm3,... 

Использование beautifulSoup, это до сих пор, что я пытался:

from bs4 import BeautifulSoup 
from urllib import urlopen, urlretrieve, quote 

url_base = 'https://www.og.decc.gov.uk/information/wells/pprs/Well_production_onshore_oil_fields/onshore_oil_fields_by_well/onshore_oil_fields_by_wel.html' 
u = urlopen(url_base) 
html = u.read().decode('utf-8') 
u.close() 
soup = BeautifulSoup(html) 

Но это получить только главную информацию страницы, а не страницы кадров. Когда я меняю базу url на ссылку фрейма, она сообщает мне, что запрошенная страница устарела.

+0

Пожалуйста, объясните более ясно, что это ваша проблема, потому что когда я загрузить страницу я вижу, все страницы в меню боковой панели, и только вы ahve щелкнуть ссылку или ссылку на нее –

+0

@ Vkt0r Я не понимаю ваш комментарий. Пожалуйста, прочитайте ответ ниже! – agstudy

ответ

1

Я думаю, что вы копируете неправильный URL-адрес. Когда я использую следующее, это сработало.

url_base = 'https://www.og.decc.gov.uk/information/wells/pprs/Well_production_onshore_oil_fields/onshore_oil_fields_by_well/0.htm' 

Внимание: это .../onshore_oil_fields_by_well/0.htm,

вместо .../onshore_oil_fields_by_well/0.html

+0

Мой плохой! благодаря! Кажется, я должен пойти в кофемашину! – agstudy

+0

@agstudy Я сделал ту же ошибку и в начале тоже. :) – Ray

Смежные вопросы