Я ползком через сайт с помощью Scrapy, и я хочу, чтобы отформатировать распакованные сухари для создания сайта путь:сухари формат Scrapy с помощью XPath
HTML:
<ul id="breadcrumbs"><li><a href="/site/ID/home">Home</a></li> <li><a href="/site/ID/AboutUs">Who We Are</a></li></ul>
Что я делаю:
breadcrumb = response.xpath("//ul[@id='breadcrumbs']")[0].extract()
Что я получаю сейчас:
<ul id="breadcrumbs"><li><a href="/site/ID/home">Home</a></li> <li><a href="/site/ID/AboutUs">Who We Are</a></li></ul>
Что мне действительно нужно:
/home/AboutUs/
Любая идея, как я должен написать в XPath или как я должен форматировать результаты?
Это сработало! Чем больше я пытаюсь убежать от регулярного выражения, тем больше он возвращается ко мне – user988544