Анализ HTML с помощью Hpricot & Ruby - получение самого внутреннего html?

Я ищу, чтобы разобрать какой-то старый html, у которого есть много посторонних тегов, которые можно сделать с помощью CSS сейчас - ,  и т. Д. Я использую Hpricot для его синтаксического анализа, но я хочу получить самый внутренний «inner_html», - Как это сделать с Hpricot? Например, скажем, пользователь Hpricot, чтобы захватить все элементы <table>, которые я просматриваю, чтобы получить строки и ячейки, но я хочу получить данные внутри ячеек, но у них не может быть никаких дополнительных тегов или таких вещей, как 1,000. трюк, чтобы получить только «1000»?Анализ HTML с помощью Hpricot & Ruby - получение самого внутреннего html?

Спасибо,
Бен

источник

2010-10-09 user21293

Я не уверен, если это полностью то, что вы хотите, но вы можете захотеть взглянуть на inner_text метода. Он вернет то же, что и inner_html, за исключением того, что все элементы HTML будут удалены.

источник

2010-10-09 03:13:30 AboutRuby

Анализ HTML с помощью Hpricot & Ruby - получение самого внутреннего html?

ответ

Смежные вопросы