2015-11-29 3 views
0

Мне нужно извлечь часть в href только один раз. Однако я также необходимо указать, что он должен соответствовать только hrefs, где следующий текст: Launch Information Processing Workflow,Регулярное совпадение слишком много результатов

<a class="wcmListViewLink" target="_blank" href="getContent?objectStoreName=Nice&vsId=%7BE6B85994-9B93-4A3C-878A-C7BBBA39BAD8%7D&objectType=document&folderId=%7BB51627F8-D74C-4607-ADD7-AC9C125D67F9%7D">Launch Information Processing Workflow</a> 

Следующие reged работали:

href="(.+?)%7D" 

Как я могу сделать его более конкретным и требуют Launch Information Processing Workflow текст?

ответ

2

Вы забываете добавить .* в соответствие любым символам между " и >Launch.
(Eg: href="link" class="btn">Launch)

Это следует роботи:

/href="(.+?)\".*?>Launch/ 

Вы можете проверить его здесь: https://regex101.com/r/rN0tI5/2

+0

что работал :) спасибо! – DMC

0

It is not very recommended to parse HTML using regular expressions, рассмотреть вопрос об использовании XPath Extractor настроен следующим образом:

  • Номер ссылки: any reaso Nable имя переменной
  • Выражение XPath: //a[text()='Launch Information Processing Workflow']/@href
  • Проверить Use Tidy окно только в случае ответа не XHTML-совместимый
Смежные вопросы