2010-04-29 3 views
2

У меня возникли трудности с соскабливанием динамически сгенерированной таблицы в ASPX. Попытка скрестить цены на газ с такого сайта GasPrices. Я могу извлечь всю информацию в таблицу цен на газ (адрес, время и т. Д.), За исключением фактической цены на газ.Скребок * .aspx содержимое с использованием Python

Есть ли способ, чтобы я мог царапать цены на газ? то есть получить текстовое представление. Я не очень хорошо знаком с ASP/ASPX, но то, что сейчас создается, не появляется в финальном HTML. Я использую Python для очистки, но это не имеет значения, если нет конкретной библиотеки ...

Заранее спасибо.

+0

Какие цены на газ? К чему эта ссылка? – ash

+0

oops. неправильная ссылка. исправлено. – tomato

+0

Возможный дубликат http://stackoverflow.com/questions/2741420/scraping-aspx-content-using-python –

ответ

4

Происхождение страницы (aspx) здесь не является проблемой.

Похоже, они активно пытаются сорвать попытки скремблирования. Числа не шрифты, а несколько элементов div рядом друг с другом с background images, которые являются числами. Они действительно не хотят, чтобы их царапали.

(конечно, если вы действительно были определены, вероятно, можно отобразить имя класса дел до ... Они не очень хорошо «зашифрован»)

Примите к сведению уведомление об авторских правах в нижней части страницы

+0

Согласны, факт, что они кодируют свои цены изображениями, предполагает, что они не хотят, чтобы их царапали. Вы должны это уважать. –

+0

Абсолютно будет уважать это. Благодарю. – tomato

Смежные вопросы