2014-03-02 2 views
-1

Обратите внимание, что этот вопрос не касается реализации, а для подсказок программирования.Как бы вы проанализировали эту строку для объекта?

Я пытаюсь прочитать некоторый код HTML, а затем создать объект/несколько объектов, чтобы снова рисовать его.

Например. Представьте себе этот HTML:

<body> 
Hello, this is some plain and I'm going to attach an image. 
<img src="someimage.jpg" /> 
And after the image I keep writting. 

And as this is a forum message, you can add a div to quote like the following: 
<div class="post-quote"> Some user said something</div> 

And that was it! 
</body> 

Как вы можете видеть, есть несколько элементов, как <img> и <div>.

Моя главная цель, чтобы иметь все распались, как:

  • Текст
  • Изображение
  • Текст
  • Div (цитата класс)
  • Текст

И то, программируя специфически, оно могло быть ListcontentElements. С этим списком я мог бы нарисовать эти элементы на экране, отформатированном и размещенном на экране.

Однако я не могу определить, как разделить строку HTML с помощью некоторого логического метода.

У вас есть какие-либо советы? Как бы вы разделили эту строку для достижения ранее объясненной проблемы?

Спасибо!

Вопросы приветствуются!

Редактировать JSOUP - это синтаксический анализатор. Я не ищу парсер. Я ищу СОВЕТЫ о том, как я могу сохранить порядок анализируемых элементов. Перечитайте мой вопрос, пожалуйста!

+0

использование HTML-парсер, как http://jsoup.org/? – eis

ответ

0

Вы должны использовать HTML-парсер, такой как jsoup.

Пример на вашем HTML:

Document doc = Jsoup.parse(html); 

print(doc.select("img").attr("src"));  ==> someimage.jpg 
print(doc.select("div.post-quote").text()); ==> Some user said something 
+0

С этим я могу извлечь div и вещи, которые я уже делаю. Но как вы «держите» их в порядке? Перечитайте мой вопрос, пожалуйста: D – Reinherd

+0

Прочтите документацию jsoup. Здесь кратко объясняется. http://jsoup.org/cookbook/extracting-data/dom-navigation –

+0

Я не могу найти то, что вы сказали. – Reinherd

Смежные вопросы