У меня есть код php, который может извлекать категории продуктов на этом сайте: http://www.tradeindia.com/. До сих пор мне удалось извлечь только категории. Как сделать так, чтобы он также извлекал номера продуктов рядом с ним, так как он не был в имени какого-либо класса?Скребок сайта с использованием PHP
Мой код:
<?php
//header('Content-Type: text/html; charset=utf-8');
$grep = new DoMDocument();
@$grep->loadHTMLFile("http://www.tradeindia.com/");
$finder = new DomXPath($grep);
$class = "cate_menu";
$nodes = $finder->query("//*[contains(@class, '$class')]");
$total_L = 0;
foreach ($nodes as $node) {
$span = $node->childNodes;
echo '<br>' . $span->item(0)->nodeValue . ' : ';
}
?>
Исходный код с сайта:
<td align="left" style="padding-left:8px;color:blue"><a href=/Seller/Agriculture/ class="cate_menu" >Agriculture</a>(100892)</td>
<td align="left" style="padding-left:8px;color:blue"><a href=/Seller/Apparel-Fashion/ class="cate_menu" >Apparel & Fashion</a>(237902)</td>
<td align="left" style="padding-left:8px;color:blue"><a href=/Seller/Automobile/ class="cate_menu" >Automobile</a>(78614)</td>
мне нужны цифры в скобках.
регулярное выражение будет делать свою работу достаточно хорошо в этом случае. – Raptor
если возможно, я хочу сделать это с помощью этого способа (domdocument) – Cael
привет, cael, какие продукты вы соскабливаете? отличные продукты? – Ghost