String HTML = some HTML source code that contains String a,b
String a = "<a class="cit-dark-link" href="http://scholar.google.ca/scholar?oi=bibs&hl=en&cites=6912391300348162186">88</a>"
String b = "<a class="cit-dark-link" href="http://scholar.google.ca/scholar?oi=bibs&hl=en&cites=18217435431424551679">41</a>"
String ex = ?
Pattern patternObject = Pattern.compile(ex);
Matcher matcherObject = patternObject.matcher(HTML);
while (matcherObject.find()) {
System.out.println("DEBUG: Cite is " + matcherObject.group(1));
}
Привет, я новичок в JAVA и Regex, и мне интересно, как я могу написать String ex, чтобы он печатал только. (Я надеюсь, что я достаточно ясно)java pattern compile regex
Cite 88
Cite является 41
Используйте правильный HTML-парсер, чтобы сделать это: загружать входную строку, найти '' тег с заданным класса, напечатайте его значение узла. Готово. –
Спасибо за ответ. Как я могу сделать это без пакета парсера HTML? – user116064
Как вы можете сделать это с помощью парсера HTML? Неразумно. http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –