2016-11-24 2 views
1

Мне нужно очистить документ Nokogiri :: HTML :: DocumentFragment (удалить узлы комментариев и текстовые узлы, содержащие только пробелы). Вот пример:Найти комментарии или текстовые узлы в фрагменте документа

html = "<p>paragraph</p><!-- comment --><p>paragraph</p> <p>paragraph</p>" 
doc = Nokogiri::HTML::DocumentFragment.parse html 

фрагмент документа выглядит так, как и следовало ожидать:

#(DocumentFragment:0x3fc65f9f5870 { 
    name = "#document-fragment", 
    children = [ 
    #(Element:0x3fc65f9f5064 { name = "p", children = [ #(Text "paragraph")] }), 
    #(Comment " comment "), 
    #(Element:0x3fc65f9f4f60 { name = "p", children = [ #(Text "paragraph")] }), 
    #(Text " "), 
    #(Element:0x3fc65f9f4e48 { name = "p", children = [ #(Text "paragraph")] }) 
    ] 
}) 

Как я могу найти все комментарии или все текстовые узлы в этом фрагменте документа?

Следующая не работают, потому что это не полный документ, а фрагмент документа:

doc.search('//text()') 
doc.search('//comment()') 

ответ

2

Фигурные это:

doc.search('.//text()') 
doc.search('.//comment()')