Прежде всего, я знаю, что разбор HTML с регулярным выражением является плохим. Но, к счастью, веб-сайт, который я извлекаю код, прост, поэтому я всегда получаю хорошие результаты, используя этот метод.Regex in java compile
Pattern p = Pattern.compile("(?<=<span class=\\\"itemName\\\">).*(?=</span>)");
Matcher m = p.matcher(code);
Это должно вернуть то, что находится между тегом «itemname» и «тегом span». Нечто подобное:
PESCA INSOLITA
Но, вместо этого, он возвращает:
PESCA INSOLITA</span></a><li><a href="/uy/synop...
Что я делаю неправильно?
* «Что я делаю неправильно?» * - Вы уже ответили, что - * «Я знаю, что разбор HTML с регулярным выражением плох» *. .. :-) –