Я делаю скрипт для получения всех ссылок с веб-сайта, но хочу получить только ссылки с определенным словом. У меня есть следующий сценарий, и теперь я могу получить все ссылки, и я не знаю, как создать regx для поиска слова я хочу:Получить все ссылки, содержащие слово
$url = file_get_contents("http://www.example.es");
preg_match_all("/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is", $url, $todosenlaces);
это невозможно сделать правильно с регулярным выражением - http://stackoverflow.com/questions/4702987/php-string-manipulation-extract-hrefs – birdspider
Где это слово должно быть? В анкерном тесте или в url? –
Я бы посоветовал вам использовать некоторую библиотеку для выполнения тяжелой работы. В этом случае вы можете перейти к компоненту [symfony DomCrawler] (http://symfony.com/doc/current/components/dom_crawler.html) + [symfony CssSelector component] (http://symfony.com/doc/current /components/css_selector.html). Они предназначены для совместной работы, вы можете использовать jQuery, как селектор в PHP, вам просто нужно кормить DomCrawler с помощью строки с веб-страницы. – mTorres