Я новичок в регулярных выражениях и тому подобное. У меня мало знаний, и я думаю, что моя текущая проблема связана с ними.Как найти URL-адрес на странице
У меня есть веб-страница, содержащая текст. Я хочу получить ссылки с веб-страницы, которые находятся только в SPAN
с, которые имеют class="img"
.
Я прохожу через эти шаги.
- захватить все
SPAN
с тегом классом «IMG» (это трудный шаг, который я ищу) - ход эти
SPAN
S к новым переменным - Разбирают переменный, чтобы получить массив со ссылками (Каждый
SPAN
имеет только 1 ссылку, так что это будет легко)
Я использую PHP, но и любой другой язык не имеет значения, я смотрю, как иметь дело с первым шаг. У кого-нибудь есть предложение? спасибо: D
+1 Согласен, скребок страницы намного веселее с разбором DOM в отличие от регулярных выражений. – karim79
+1 хотя он будет работать только на хорошо оформленных документах XHTML. – vartec
Спасибо, я просто знал, как полезен Xpath :) –