2017-01-12 3 views
1

Я пытаюсь очистить таблицу найденную на этой статической странице:царапать стол с ASX страницы

http://www.asx.com.au/prices/targetratetracker.htm

С помощью простого скребка на основе пользовательского интерфейса нашел here, чтобы проверить, вы можете увидеть, что он не возвращает таблицу даже при использовании настройки KeepEverythingExtractor.

Использование инспектора на targetratetracker.htm странице мы можем увидеть следующее:

A Parser-blocking, cross-origin script, http://www.adobetag.com/d4/v2/.../amc.js, is invoked via document.write. 

Я агностик, какой библиотеке или язык использовать, просто хочу знать, если есть способ обойти блокатора (если это действительно проблема).

+0

так что вы хотите достичь, что с помощью JavaScript или Python? – Sojtin

+0

В идеале с JS, но решение с использованием Beautiful Soup также прекрасно. – Martin

ответ

1

Эта страница использует фрейм, который означает, что страница содержит другую страницу, enter image description here

Адрес страницы: http://www.asx.com.au/data/trt/TargetRateTracker.htm

+1

Да, я только что нашел это и вернулся, чтобы опубликовать его, только чтобы увидеть, как вы избили меня. – Martin

Смежные вопросы