2012-04-11 2 views
1

Im используя механизацию для разбора http://www.hammacher.com/Category/Default.aspx?uq=Gifts-Under-30&all=TrueXPaths и HTML Анализ с использованием механизировать

Что я могу XPath использовать, чтобы добраться до каждого HREF на этой странице, чтобы каждая страница продукта может быть принята?

Это то, что я пытаюсь сейчас, а не получить полный URL:

page = agent.get('http://www.hammacher.com/Category/Default.aspx?uq=Gifts-Under-30&all=True')  
page.parser.xpath('//*[contains(concat(" ", @class, " "), concat(" ", "product_list_sub", " "))]//a')[5].attributes['href'].to_s 

Кроме того, возможно, при использовании Mechanize для синтаксического анализа для двух различных XPATH селекторов в том же заявлении?

Заранее благодарен!

ответ

0

Попробуйте

page.links_with(:href => /Product\/Default.aspx\?sku/) 
Смежные вопросы