2010-10-09 2 views
0

Я ищу, чтобы разобрать какой-то старый html, у которого есть много посторонних тегов, которые можно сделать с помощью CSS сейчас - <b>, <font> и т. Д. Я использую Hpricot для его синтаксического анализа, но я хочу получить самый внутренний «inner_html», - Как это сделать с Hpricot? Например, скажем, пользователь Hpricot, чтобы захватить все элементы <table>, которые я просматриваю, чтобы получить строки и ячейки, но я хочу получить данные внутри ячеек, но у них не может быть никаких дополнительных тегов или таких вещей, как <b><font ...>1,000</font></b>. трюк, чтобы получить только «1000»?Анализ HTML с помощью Hpricot & Ruby - получение самого внутреннего html?

Спасибо,
Бен

ответ

1

Я не уверен, если это полностью то, что вы хотите, но вы можете захотеть взглянуть на inner_text метода. Он вернет то же, что и inner_html, за исключением того, что все элементы HTML будут удалены.

Смежные вопросы