Я обновляю свой сайт, чтобы установить rDNS, однако я здесь, чтобы спросить ваше мнение о том, как это справится с моей проблемой. У меня есть все IP (IPv4) в массиве с именем $aIP
. Теперь у меня есть список, как это:Извлечение текста из HTML
<tr><td>1.2.3.4</td><td>hostname.bla.com</td><td><a href="edit-reverse.cgi?id=1">myserver.com</a></td></tr>
<tr><td>1.2.3.5</td><td>hostname.bla.com</td><td><a href="edit-reverse.cgi?id=2"><i>not set</i></a></td></tr>
<tr><td>1.2.3.6</td><td>hostname.bla.com</td><td><a href="edit-reverse.cgi?id=3"><i>not set</i></a></td></tr>
<tr><td>1.2.3.7</td><td>hostname.bla.com</td><td><a href="edit-reverse.cgi?id=4">test.myserver.com</a></td></tr>
<tr><td>1.2.3.8</td><td>hostname.bla.com</td><td><a href="edit-reverse.cgi?id=5"><i>not set</i></a></td></tr>
<tr><td>1.2.3.9</td><td>hostname.bla.com</td><td><a href="edit-reverse.cgi?id=6"><i>not set</i></a></td></tr>
Теперь мне нужно текущее значение RDNS (в данном случае, либо myserver.com
или not set
или test.myserver.com
) и мне нужно значение или полный URL, который он связывает с (edit-reverse.cgi?id=1
или 1
), который связан с IP-адресом в массиве $aIP
.
Это будет ожидаемый результат (не особо в этом формате вывода, а быть в массиве или что-то):
1.2.3.4 => 1, myserver.com
1.2.3.5 => 2, not set
1.2.3.6 => 3, not set
1.2.3.7 => 4, test.myserver.com
1.2.3.8 => 5, not set
1.2.3.9 => 6, not set
Пожалуйста, имейте в виду, что не все IP-адреса у меня может быть в $aIP
массиве , поэтому в основном он должен прокручивать HTML-код и искать значения в соответствии с массивом $aIP
.
Я думал об использовании регулярного выражения, но потом я не знаю много о них, поэтому это, вероятно, будет очень неэффективным кодом. Какой был бы лучший способ справиться с этим?
Обсуждали ли вы использование парсера HTML для анализа этого HTML? – Borealid
http://simplehtmldom.sourceforge.net/ – Crontab
То, что вы НЕ хотите делать, это использовать регулярные выражения. Вот почему: http://htmlparsing.com/regexes –