2012-05-21 11 views
-1

У меня есть HTML строка:Удаление HTML тегов из строки

<span class=thisword>anh</span><br /> 
-grand frère</span><br /> 
-cousin (fils d'un grand frère ou d'une grande soeur du père ou de la mère)</span><br /> 
-(nom générique désignant un homme encore jeune)</span><br /> 

Я хочу, чтобы получить строки в нем. я сделал следующее:

Elements ed=docu.getElementsByTag("span"); 
for(Element e: ed) 
{ 
    System.out.println(removeHTML(e.toString())); 
    // removeHTML is method remove tags in HTML receive 
} 

Это только отображается строка

anh 

Я хочу, чтобы отобразить

anh -grand frère -cousin (fils d'un grand frère ou d'une grande soeur du père ou de la mère) -(nom générique désignant un homme encore jeune) 

, но я не имел никакого успеха. Вы можете мне помочь?

+0

Это возможно дубликат [ "Удаление HTML из Java String."] (Http://stackoverflow.com/questions/240546/removing-html-from-a-java-string) – creemama

ответ

1

HTML недействителен ... вы ничего не можете ожидать от этого.

Ваша программа, вероятно, выводит четыре строки: одну с текстом, остальные три пустые. Ваш HTML интерпретируется как это (по крайней мере, для большинства браузеров):

<span class=thisword>anh</span><br /> 
-grand frère<span></span><br /> 
-cousin (fils d'un grand frère ou d'une grande soeur du père ou de la mère)<span></span><br /> 
-(nom générique désignant un homme encore jeune)<span></span><br /> 

Вы не открывать все эти другие пролеты, что вы якобы закрытия. Вам нужно, чтобы начать новый срок перед каждой строкой текста, если вы хотите, чтобы все это должны быть включены:

<span class=thisword>anh</span><br /> 
<span>-grand frère</span><br /> 
<span>-cousin (fils d'un grand frère ou d'une grande soeur du père ou de la mère)</span><br /> 
<span>-(nom générique désignant un homme encore jeune)</span><br /> 
+0

Ok Я снова посмотрю! –

0

Html структура не кажется правильным. У вас есть один промежуток открытия и четыре закрытия. Это может быть одной из причин.

0

Правильный HTML должен быть:

<span class="thisword">anh</span><br /> 
<span>-grand frère</span><br /> 
<span>-cousin (fils d'un grand frère ou d'une grande soeur du père ou de la mère)</span><br /> 
<span>-(nom générique désignant un homme encore jeune)</span><br /> 

Следует отметить следующие:

  • Классы должны быть даны в кавычках.

  • Каждый блок должен быть закрыт и открыт в соответствующих <p> или <div>. <span> должен иметь соответствующий </span> внутри них.

  • Пространства не должны пересекаться друг с другом.

+0

Не должно перекрываться? Говорит кто? – animuson

+0

В идеале, когда вы разбираете пробелы. вы не должны. – Niranjan

+0

Но HTML-строка, которую я получаю из Интернета, не так, как вы пишете. –

Смежные вопросы