У меня возник вопрос о поиске тегов html с использованием Java и Regex.Вопрос о разборе HTML с использованием Regex и Java
Я использую следующий код, чтобы найти все теги в HTML, documentURL, очевидно, является содержимым HTML.
Метод find возвращает true, что означает, что он может найти что-то в HTML, но метод matches() всегда возвращает false, и я полностью и полностью озадачен этим.
Я также ссылался на документацию по Java, но не смог найти ответ.
Каков правильный способ использования Matcher?
Pattern keyLineContents = Pattern.compile("(<.*?>)");
Matcher keyLineMatcher = keyLineContents.matcher(documentURL);
boolean result = keyLineMatcher.find();
boolean matchFound = keyLineMatcher.matches();
Делать что-то вроде этого бросает Exeption:
String abc = keyLineMatcher.group(0);
Спасибо.
Не ответ, который вы хотели, но избежать разбора HTML с регулярным выражением. Правильный способ - использовать парсер HTML. http://java-source.net/open-source/html-parsers – Yacoby