Я пытаюсь скрести данные из результатов по поиску из this websiteскребковые данные с классом simple_html_dom в PHP
Мне сказали, что лучший способ сделать это, чтобы использовать класс simple_html_dom из http://simplehtmldom.sourceforge.net/ The страница результатов очень занята, и у меня возникают проблемы с очисткой моих очищенных данных.
Я получаю содержимое страницы с:
$html = file_get_html('http://www.birthdatabase.com/cgi-bin/query.pl?textfield=' . $first . '&textfield2=' . $last . '&age=&affid=');
код, который я был любезно Предоставленная:
$n = 0;
foreach($html->find('table tbody tr td div font b table tbody') as $element) {
@$row[$n]['tr'] = $element->find('tr')->text;
$n++;
}
// output your data
print_r($row);
ли это DOM навигация правильно? Есть ли лучший способ получить скребковые данные?
Thanks
У них расширенные селекторы. См. Там онлайн-документацию. Это хорошо документировано – 2013-03-25 03:18:15
Я довольно нуб. Можете ли вы помочь мне улучшить очистку? – ChanCanasta
Вы должны показать свой html exmine мной – 2013-03-25 03:30:31