Обратите внимание, что этот вопрос не касается реализации, а для подсказок программирования.Как бы вы проанализировали эту строку для объекта?
Я пытаюсь прочитать некоторый код HTML, а затем создать объект/несколько объектов, чтобы снова рисовать его.
Например. Представьте себе этот HTML:
<body>
Hello, this is some plain and I'm going to attach an image.
<img src="someimage.jpg" />
And after the image I keep writting.
And as this is a forum message, you can add a div to quote like the following:
<div class="post-quote"> Some user said something</div>
And that was it!
</body>
Как вы можете видеть, есть несколько элементов, как <img>
и <div>
.
Моя главная цель, чтобы иметь все распались, как:
- Текст
- Изображение
- Текст
- Div (цитата класс)
- Текст
И то, программируя специфически, оно могло быть List
contentElements
. С этим списком я мог бы нарисовать эти элементы на экране, отформатированном и размещенном на экране.
Однако я не могу определить, как разделить строку HTML с помощью некоторого логического метода.
У вас есть какие-либо советы? Как бы вы разделили эту строку для достижения ранее объясненной проблемы?
Спасибо!
Вопросы приветствуются!
Редактировать JSOUP - это синтаксический анализатор. Я не ищу парсер. Я ищу СОВЕТЫ о том, как я могу сохранить порядок анализируемых элементов. Перечитайте мой вопрос, пожалуйста!
использование HTML-парсер, как http://jsoup.org/? – eis