2012-02-19 5 views
0

Я собираю функцию быстрого извлечения в PHP. В основном, он будет читать содержимое данного URL-адреса и извлекать необходимый код HTML. Затем он помещает код в новую страницу. Теперь я все работаю, кроме одного.PHP: Извлечение текста из строки между двумя конкретными тегами

У меня есть строка с содержимым URL-адреса, и теперь я хочу извлечь текст между двумя тегами. Предположим, я хочу начать копирование контента по определенному тегу. Это легко, так как эти теги имеют классы.

Итак, у меня была бы функция начинаться с "" Она просто ищет документ для всего текста, который соответствует этому. Однако я столкнулся с проблемой. В разделе, которое я хочу скопировать, есть другие теги. Таким образом, если я скажу функции прекратить извлечение на «,», скребок перестанет читать в конце случайного тега. Может кто-нибудь помочь мне написать немного PHP-кода, который гарантирует, что тег, который функция останавливается, является закрывающим тегом для «", а не для какого-либо случайного тега, который находится в строке?

Заранее спасибо.

+4

Используйте парсер HTML. – Blender

+2

[Почему люди так любят Ктулху?] (Http://stackoverflow.com/a/1732454/871050) –

+0

дубликат около 10 триллионов других вопросов S.O. –

ответ

3

Невозможно сделать это и учитывать все возможные содержания между тегами. Используйте XmlDocument и проанализируйте HTML.

Смежные вопросы