Я использую библиотеку Crawler, которая поможет вам сделать некоторые выражения XPath для получения содержимого тегов HTML. В настоящее время я читаю содержимое HTML5 со страницы, и я хочу получить текст, который не вставлен в тег таким образом.Как использовать XPath для выбора дочернего текста после другого дочернего элемента
<div class="country">
<strong> USA </strong>
Some text here
</div>
Так что я пытаюсь получить этот текст Некоторые тексты здесь но библиотека гусеничной позволяет получить только то, что в теге, а не за его пределами.
Так что любая альтернатива, пожалуйста.
Это самый Гусеничный часть:
$crawler = new Crawler();
$crawler->xpathSingle($xml, '//div[@class="country"]/strong/@text');
и что произойдет, если вы попробуете этот XPath: '// div [@ class =" country "]/strong/follow-sibling :: text()'? потому что я не знаком с этой библиотекой «Crawler» - я знаю, что этот XPath работает, например, с использованием lxml в python. –
Спасибо, чувак, он работает. Но он получает весь текст после сильного тега, даже если этот текст принадлежит к другим тегам. – KubiRoazhon