У меня есть проблемы с получением данных с использованием nokogiri с этим кодом:Получить данные из JQuery
def run
# load HTML content to doc
doc = Nokogiri::HTML(open(@link))
cells = doc.css('div#z_full_column > div.content')
puts cells # just to see what i've got while running code
end
с этого сайта:
http://www.staples.com/sbd/cre/marketing/back-to-school/back-to-school-deals/weekly-deals.html
Все данные ушли. Я вижу только <div class="content"></div>
. Я пытался поставить sleep 5
в каждый код, но это бесполезно. Возможно, проблема здесь вызвана jquery.
[OpenURI] (http://ruby-doc.org/stdlib-2.0.0/libdoc/open-uri/rdoc/index.html) ISN Это драгоценный камень, это часть Ruby's Std-lib. «open-uri не поддерживает javascript»? OpenURI не заботится о том, каков контент, он только извлекает то, что возвращается ему. Что мы делаем с этим контентом, зависит от нас. Если JavaScript возвращается, OpenURI вернет его. Проблема с кодом OP заключается в том, что Nokogiri не будет анализировать JavaScript. –
Приятный, но он работает медленно, потому что он должен открыть браузер –