Я буду первым, кто признает, что мое знание Regex безнадежно. Я использую Java со следующимиRegex для извлечения содержимого ссылки
Matcher m = Pattern.compile(">[^<>]*</a>").matcher(html);
while (m.find()) {
resp.getWriter().println(html.substring(m.start(), m.end()));
}
я получаю следующий список:
>Link Text a</a>
>Link Text b</a>
Что мне не хватает, чтобы удалить >
и </a>
.
Cheers.
@Littlejon - Regex + HTML вопросы не очень популярны в наши дни. (Кстати, я не получаю в середине этого снова ... предыдущий был моим самым нисходящим ответом. http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml самообъявленные теги) – Kobi
@ Kobi - Итак, я видел. Но я только ищу фрагмент HTML. Также пытался использовать DOM без особого успеха. – Littlejon
В качестве дополнения я полностью осознаю ограничения и полностью готов указать заряженный пистолет на мою собственную ногу :-) – Littlejon