Мне нужно получить некоторые данные с веб-страницы. После анализа HTML-кода страницы я обнаружил, что необходимые мне данные встраиваются в таблицу с уникальным идентификатором таблицы. Я не знаю, является ли это правилом HTML или нет, во всяком случае, это очень хорошо для синтаксического анализа, я думаю.Как я могу извлечь данные таблицы HTML с помощью Perl?
Данные в таблице расположен, как показано ниже (различные атрибуты и теги были опущены для того, чтобы дать вам четкие «структуры данных»)
<table .... id = "tablename" .... >
<tr>
<td .... >filed1</td>
....
<td .... >filedn</td>
</tr>
#several "trs" here
<tr>
<td .... >filed1</td>
....
<td .... >filedn</td>
</tr>
</table>
Так что мой вопрос заключается в том, как использовать HTML-парсер в Perl утилита для удовлетворения моих потребностей в этом случае.
Заранее спасибо.
Вам не нужно вдаваться в HTML :: Parser для этого. На нем есть много инструментов, которые должны быть в состоянии справиться с работой. –