2013-02-03 2 views
1
  String url = request.getParameter("url"); 
      Document doc = Jsoup.connect(url).get(); 
      Elements web = doc.childern.select("*"); 
      for(Element ele : web) 
      { 
       if(ele.hasText()) 
       ele.text("hello"); 

      } 

, когда я распечатать документ его реструктуризации, как привет привет приветJSOUP Документ вопрос Структура HTML

вместо

     <html> 
         <head> 
         <title> 
         hello 
         </title> 
         <body> 
          hello 
          </body> 
          </html> 

ответ

0

Но где проблема?

, если вы хотите, за исключением head -tag из ваших изменений вы можете использовать это:

Elements web = doc.body().select("*"); 

Это дает только тело-элементы, которые вы можете изменить в настоящее время.

+0

Проблема заключается в том, после разбора тегов не структурированы правильно, как вместо этого он будет как –

+0

особенно '' выглядит странно для меня. Какую версию Jsoup вы используете (1.7.2 - текущая)? В качестве теста, пожалуйста, вызовите 'normalize()' -метод в вашем документе. – ollo

+0

хорошо проблема в этом ... проверьте это http://stackoverflow.com/questions/9853880/jsoup-parse-and-nested-tags –

Смежные вопросы