У меня есть список пунктов:Получить HTML атрибуты из цикла
<div class="item">
<a href="//external-link.com">
<img src="main-image.jpg" alt=""/>
</a>
<h2> Title </h2>
<p> Description lorem here </p>
</div>
<div class="item">
<a href="//external-link.com">
<img src="main-image.jpg" alt=""/>
</a>
<h2> Title </h2>
<p> Description lorem here </p>
</div>
<div class="item">
<a href="//external-link.com">
<img src="main-image.jpg" alt=""/>
</a>
<h2> Title </h2>
<p> Description lorem here </p>
</div>
Я хочу, чтобы извлечь текст <h2>
тега, и «SRC» и «HREF» из <a>
и <img>
тегов, но Я не могу понять, как извлечь атрибуты «src» и «href».
Это что-то вроде того, что я использую:
require 'nokogiri'
require 'open-uri'
pageURL = 'http://ticketdriver.com/amg/buy/tickets'
page = Nokogiri::HTML(open(pageURL), nil, 'UTF-8')
page.css('.item').each do |node|
title = node.css('h2').text
srcUrl = node.css('img')['src']
end
text
часть работает, но я не могу получить доступ к ключу и значение для дочерних элементов «.item». Я пробовал children[0]
, [0]['src']
, [:src]
, attr()
, attribute()
и еще несколько.
У меня полно идей и страниц поиска Google.
Добро пожаловать в переполнение стека. Пожалуйста, избегайте использования приветствий («Привет, я новичок в Ruby and nokogiri.»), Валидации или подписи. Stack Overflow - это не разговор, вместо этого мы пишем статьи о том, как решать проблемы. –