2011-06-17 6 views
-1

У меня есть HTML-код, который выглядит следующим образом:Получить индекс элемента HTML

String html = "<html><head><style type=\"text/css\"></style></head><body><div style=\"font-family:times new roman,new york,times,serif;font-size:14pt\">first text<br><div><br></div><div style=\"font-family: times new roman,new york,times,serif; font-size: 14pt;\"><br><div style=\"font-family: times new roman,new york,times,serif; font-size: 12pt;\"><font size=\"2\" face=\"Tahoma\"><hr size=\"1\"><b><span style=\"font-weight: bold;\">one:</span></b> second text<br><b><span style=\"font-weight: bold;\">two:</span></b> third text<br><b><span style=\"font-weight: bold;\">three:</span></b> fourth text<br><b><span style=\"font-weight: bold;\">five:</span></b> fifth text<br></font><br>"; 

и мне было интересно, как получить индекс третьего DIV?

ответ

0

Парсер DOM/XML может быть лучше, в зависимости от того, что вам нужно делать. Но простой способ:

int index = -1; 
for(int i=0; i < 3; i++){ 
    index = html.indexOf("<div",index + 1); 
    if(index == -1) 
     throw new Exception(); 
} 
4

Я бы использовал парсер DOM для этого. Если у вас есть надлежащий XML (действительный XHTML) контент, вы также можете использовать синтаксический анализатор XML.

И в какую библиотеку выбрать, this question поможет вам.

Обновление: насколько я могу судить, ваш контент недействителен. XML. Так что this question может быть лучше для вас.

+0

Есть ли какие-либо образцы для чего-то вроде того, что я хочу сделать? –

+0

для чего? действительная или недопустимая часть? –

+0

Какая недопустимая часть, о которой вы говорите? –

Смежные вопросы