2016-11-02 2 views
0

Я пытаюсь разобрать HTML-документ, но я не знаю, с чего начать.Разбор HTML-документа с использованием JavaScript (Node)

Допустим, у меня есть, <div><p>Hello world</p></div>

Есть ли способ, чтобы разобрать это, так что я получаю что-то вроде

{ name: div, 
    children: p 
} 
+1

Используйте HTML-парсер? Вы можете начать с анализатора узлов узла html. BTW, если это узел, пометьте его как таковой. –

+0

@torazaburo - Множество парсеров html, которые я обнаружил, либо сломаны, либо нет, что мне нужно, поэтому я решил сделать это сам. Я также думаю, что для меня будет хорошей практикой –

+0

@HumanCyborgRelations Вы должны рассказать нам, как они были сломаны, а не то, что вам нужно. В противном случае, написание собственного документа займет примерно 616 страниц, если вы знакомы с материалом: https://www.w3.org/TR/html5/single-page.html – Brad

ответ

0

не должно было быть, что трудно найти через Google Вот ссылка: https://www.npmjs.com/package/html-to-json

htmlToJson.parse (HTML, фильтр, [обратного вызова]) -> обещание метод синтаксического анализа() принимает строку HTML и фильтр, и отвечает отфильтрованными данными. Это поддерживает как обратные вызовы, так и обещания.

var promise = htmlToJson.parse('<div>content</div>', { 
    'text': function ($doc) { 
    return $doc.find('div').text(); 
    } 
}, function (err, result) { 
    console.log(result); 
}); 

promise.done(function (result) { 
    //Works as well 
}); 
Смежные вопросы