Я ищу, чтобы разобрать какой-то старый html, у которого есть много посторонних тегов, которые можно сделать с помощью CSS сейчас - <b>
, <font>
и т. Д. Я использую Hpricot для его синтаксического анализа, но я хочу получить самый внутренний «inner_html», - Как это сделать с Hpricot? Например, скажем, пользователь Hpricot, чтобы захватить все элементы <table>
, которые я просматриваю, чтобы получить строки и ячейки, но я хочу получить данные внутри ячеек, но у них не может быть никаких дополнительных тегов или таких вещей, как <b><font ...>1,000</font></b>
. трюк, чтобы получить только «1000»?Анализ HTML с помощью Hpricot & Ruby - получение самого внутреннего html?
Спасибо,
Бен