Я хочу извлечь содержимое страницы с именем атрибута itemprop
. Предположим, у меня есть страница, которая имеет различные HTML-теги, которые имеют атрибут с именем itemprop
поэтому я хочу, текст между этими тегами,Найти контент между тегами HTML, используя RegEx
Для заголовка:
<h1 itemprop="name" class="h2">Whirlpool Direct Drive Washer Motor Coupling</h1>
Таблица данных из тд тэгом:
<td itemprop="productID">AP3963893</td>
Здесь общий атрибут itemprop
. Поэтому мне нужны данные между этими тегами, например Whirlpool Direct Drive Washer Motor Coupling
и AP3963893
с использованием regexp.
Ниже мой код (который в настоящее время не работает)
preg_match_all(
'/<div class=\"pdct\-inf\">(.*?)<\/div>/s',
$producturl,
$posts
);
Мой код:
<?php
define('CSV_PATH','csvfiles/');
$csv_file = CSV_PATH . "producturl.csv"; // Name of your producturl file
$csvfile = fopen($csv_file, 'r');
$csv_fileoutput = CSV_PATH . "productscraping.csv"; // Name of your product page data file
$csvfileoutput = fopen($csv_fileoutput, 'a');
$websitename = "http://www.appliancepartspros.com";
while($data = fgetcsv($csvfile))
{
$producturl = $websitename . trim($data[1]);
preg_match_all(
'/<.*itemprop=\".*\".*>(.*?)<\/.*>/s',
$producturl,
$posts
);
print_r($posts);
}
Не могли бы вы предложить мне пример php с помощью regexp, потому что есть много URL-адреса продукта, который хранится в csv-файле. – Steve
Извините, я не знаю PHP. Когда вы отметили jQuery, я использовал это. –
Обновленный мой вопрос с моим кодом .. Пожалуйста, смотрите – Steve