Есть ли способ конвертировать XHTML в обычный текст с использованием Java?Преобразование XHTML в обычный текст
Может ли кто-нибудь направить меня на это?
Есть ли способ конвертировать XHTML в обычный текст с использованием Java?Преобразование XHTML в обычный текст
Может ли кто-нибудь направить меня на это?
Если вы хотите извлечь специальные данные из структуры XHTML, попробуйте jsoup. Он предоставляет jQuery-подобные методы для извлечения и управления XHTML. Вы можете перебирать все элементы html dom и получать текстовые атрибуты.
Или, если вы хотите удалить html-теги и сохранить только текст, попробуйте использовать регулярные выражения. Посмотрите на это stackoverflow thread.
Вы должны написать код. – woz
Что именно вы подразумеваете под XHTML для простого текста? XHTML - это уже обычный текстовый файл. Попробуйте открыть в редакторе (Блокнот). Вы хотите удалить все теги? Пожалуйста, предоставьте больше информации – Makky
Предположим, что у меня есть ниже XHTML, из чего мне нужно извлечь «Заголовок» и «Тело» в виде обычного текста. Есть ли способ сделать это с помощью сценария Java/Unix.
Это тестовая страница.
– Aravind