Вы ищете DIV идентифицированной "rechapta_image"
:
Затем извлечь атрибут IMG элемент внутри этого DIV src
.
Для этого вы можете выбрать простой способ, основанный на строках, или использовать библиотеку разбора HTML, такую как JSoup.
Вот пример такого экстракта URL:
http://www.google.com/recaptcha/api/image?c=03AHJ_VutGj3wvhGoQGxu6FUnG3uOWJdyB2RpSb2N5v9AQJyakMy1kKMPeDoRfADhjAj5rLqekuOzXe3cRChnA_sEN7PL68em4pI_kE3wFKUhhkqFF9jQzKJerX__InwD_DB0Ox1mKQmZVRl97yuSL62tZhYyhSqtuIta-3n0KvytB9QqSn8nXgw8
На самом деле, кажется, что коробка chapta является IFrame. Итак, найдите iframe с строкой src, содержащей «chapta». Пример такого фрейма:
<iframe src="http://www.google.com/recaptcha/api/noscriptk=6LeyFroSAAAAAJTmR7CLZ5an7pcsS5eJ3wEoWHhJ"
height="300" width="500" frameborder="0"></iframe><br/>
Итак, как только вы извлекли, что URL-адрес, используйте JSoup еще раз, чтобы найти URL к изображению. Страница неправдоподобным имеет часть этого:
Итак, обратите внимание на центр элемента, и получить элемент IMG из него.
Если вы хотите сделать это на Java, вам придется проанализировать страницу и придумать какую-либо эвристику для определения того, проанализировали ли вы изображение в кавычках или просто обычное изображение. – CodeBlind
Проблема с разбором страницы, что вы получите это: http://www.google.com/recaptcha/api/challenge?k=6LeyFroSAAAAAJTmR7CLZ5an7pcsS5eJ3wEoWHhJ Каких изменений вызова каждый раз, когда вы открываете его, так что вы Wouldn» t получить такую же проблему на странице. Ключ вызова - вот что отображает изображение здесь: http://www.google.com/recaptcha/api/image?c=#challengekey – Tyluur
как вы хотите, чтобы это было сделано? Вы хотите, чтобы ваша java-программа работала в фоновом режиме, и всякий раз, когда вы открываете сайт в своем браузере с капчей, программа скопирует URL-адрес в журнал или базу данных или что вы хотите? –