2015-07-20 3 views
0

Я хочу, чтобы очистить часть веб-сайта, позволяет сказать: www.mywebsite.com/ x1/x2Расширенный веб выскабливание

потребности веб-сайт информацию для входа.

Вам нужно открыть x1 первым, то вы нажимаете на кнопку и x2 будет открыт в всплывающем окне. Если вы закрыли x1, вы потеряли доступ к x2.

Я использовал Internet Download Manager, и я думаю, что я правильно поставил регистрационную информацию, но это не удалось, потому что нужно x1 должен быть открыт при доступе x2.

Сайт поддержки JavaScript.

+0

что такое 'IDM'? Какие инструменты, язык вы используете для запроса веб-страниц? –

+0

IDM означает программное обеспечение, называемое Internet Download Manager. – user42987

+0

Посмотрите, можете ли вы войти в систему и ** прямо ** получить доступ к www.mywebsite.com/x1/x2 без JavaScript (т. Е. Введите URL-адрес, если вам нужно). Это будет зависеть, если вы можете использовать простой скребок или нужен полный безгласный браузер (который будет намного медленнее). – halfer

ответ

0

IDM (после того, как я посмотрел), предназначен для загрузки, а не для обычного веб-соскабливания. Почему бы не использовать специальный web scraping software? Большинство из них поддерживают регистрацию и сложный html и js-driven pages scrape. Кажется, что ваш случай - это не чистая html-страница, а веб-страница с js-stuffed.

Смежные вопросы