Я получил этот HTML строку:Исключить содержимое тега из объекта Xpath
'<li><strong>Réf. Robster+ :</strong> 3185W061</li>'
мне нужно поймать ссылку 3185I061. Невозможно использовать регулярное выражение в качестве ссылки, возможно, в очень различной комбинации.
Мой объект XPath (от Scrapy) возвращает:
In [124]: xpath_var
Out[124]: <Selector xpath='//*[@id="reference"]/ul/li' data='<li> <strong>Réf. Clim+ :</strong> 318506'>
и
xp.xpath('.').extract_first()
'<li><strong>Réf. Robster+ :</strong> 3185W061</li>'
Как я могу удалить часть, по крайней мере?
На данный момент, я попытался это:
xp.xpath('./[not(self::strong)]')
Но это, кажется недопустимым выражение.
Благодарим за предложение. Как я вижу здесь, https://doc.scrapy.org/en/1.2/topics/selectors.html#using-exslt-extensions scrapy селекторов также основаны на lxml. –