2015-05-04 2 views
1

Как извлечь параметр src определенного изображения из текущей страницы с помощью Mechanize или Nokogiri?Механизировать извлечение изображений из HTML

Изображение внутри что-то похожее на это:

<div class="aaa"> 
    <div id="bbb"> 
     <div class="pp"> 
     <img src="/user/photo/photo01" alt="photo"> 
     </div> 
    </div> 
</div> 

Вот что я пытался:

agent = ::Mechanize.new 
agent.get ("some html url page") 
doc = Nokogiri::HTML(open(agent.page.uri.to_s)) 
@result = doc.css('img') 

Я признателен за любую помощь.

+2

Добро пожаловать на переполнение стека. Ожидается, что вы покажете минимальный пример того, что вы пробовали. Похоже, вы хотите, чтобы мы писали для вас код, для которого не существует переполнение стека. –

+0

Его долгое время, но никогда не поздно сделать все правильно. Итак, поскольку я решил быть активным в этом сообществе, я начал с изменения того, что я сделал неправильно в прошлом. Я извиняюсь за свое поведение, вы были правы, это было не самое лучшее, я изменил сообщение с примером того, что я пытался. Благодарю. – soltex

+0

Не нужно извиняться, по крайней мере, за то, что я вижу. Цель SO состоит в том, чтобы создать сайт, похожий на Википедию или онлайн-кулинарию, только для проблем программирования и принятых наилучших решений проблемы, справочника, другими словами. Это усилия сообщества, и даже те, кто задает вопросы, несут ответственность за достижение этих целей. Добавление кода и предоставление информации о том, что было сделано, помогает нам ответить, исключая любое количество других возможных сценариев и помогая нам помочь вам быстрее получить ответы и лучше настроиться на ситуацию. Спасибо за помощь! –

ответ

3

Следующая распечатывает атрибут src для каждого a тега в .aaa и #bbb дивы:

html = %Q{ 
    <div class="aaa"> 
    <div id="bbb"> 
     <div class="pp"> 
     <img src="/user/photo/photo01" alt="photo"> 
     </div> 
    </div> 
    </div> 
} 

doc = Nokogiri(html) 
doc.search('.aaa #bbb img').each |link| 
    puts link.attr('src') 
end 
Смежные вопросы