2013-09-13 4 views
0

Я пытаюсь проанализировать теги html из строки Java и работает отлично, используя метод Jsoup parse ниже. Единственное, что когда я вызываю метод .text, он удаляет теги строк ("\n"). Я хочу сохранить их, но у меня есть метод, возвращающий строку, любые идеи?Возврат строк из Jsoup.parse

private static String stripHTML(String html) { 
    return Jsoup.parse(html).text(); 
} 
+0

Вы пробовали getOwnText()? –

+0

Проверьте решение по этому вопросу «http://stackoverflow.com/questions/12503117/jsoup-line-feed» –

ответ

1

Новые строки не отличаются от пробелов (или последовательных пробелов или вкладок) в HTML. То, что вы вытаскиваете, не будет иметь смыслового смысла. < p> и < br />, с другой стороны ...

+0

Хотя это верно, см. Http://stackoverflow.com/a/12580364/14731 или http: //stackoverflow.com/q/5640334/14731, если вы хотите сохранить новые строки. – Gili

Смежные вопросы