Я пытаюсь извлечь значение пробега с разных страниц ebay, но я застрял, поскольку, похоже, слишком много шаблонов, потому что страницы немного разные. Поэтому я хотел бы знать, можете ли вы помочь мне с лучшей моделью. Некоторые примеры элементов являются следующие: http://cgi.ebay.com/ebaymotors/1971-Chevy-C10-Shortbed-Truck-/250647101696?cmd=ViewItem&pt=US_Cars_Trucks&hash=item3a5bbb4100 http://cgi.ebay.com/ebaymotors/1987-HANDICAP-LEISURE-VAN-W-WHEEL-CHAIR-LIFT-/250647101712?cmd=ViewItem&pt=US_Cars_Trucks&hash=item3a5bbb4110 http://cgi.ebay.com/ebaymotors/ws/eBayISAPI.dll?ViewItemNext&item=250647101696
Пожалуйста, смотрите образцы по следующей ссылке (я до сих пор не могу понять, как избежать HTML здесьregex, php, preg_match
http://pastebin.com/zk4HAY3T
Однако они не являются достаточно много, как кажется, есть еще новые паттеры ....
Я бы больше читал в regexp, так как способ, которым вы это делаете, определенно может быть улучшен. Все они могут быть выполнены с одним регулярным выражением для одного, и вы не должны пытаться сопоставить каждый атрибут и tr, но просто пропустите ту часть, где она имеет мили –