Я установил php-скрипт для запрета ботов, которые игнорируют мой файл robots.txt. Я бы хотел проверить, правильно ли он работает. есть несколько строк PHP-кода, которые я мог бы использовать для моделирования бота, spidering моего сайта. Возможно, сканируйте «n» слои глубоко, создайте простой текстовый файл результатов и проигнорируйте мой файл robots.txt и проигнорируйте rel = «nofollow».Как я могу разместить свой собственный сайт
1
A
ответ
2
wget -r -l4 –spider -D thesite.com http://www.thesite.com
из http://beeznest.wordpress.com/2012/07/01/spider-a-website-with-wget/
0
Вы можете использовать PHP Simple HTML DOM Parser: http://simplehtmldom.sourceforge.net/
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';
// Find all links
foreach($html->find('a') as $element)
echo $element->href . '<br>';
Смотрите также: http://davidwalsh.name/php-notifications
Смежные вопросы
- 1. Где я могу разместить свой собственный сайт?
- 2. Могу ли я разместить свой собственный бегун?
- 3. Как я могу разместить свой собственный пакет laravel на github?
- 4. Как разместить свой собственный nuget v3?
- 5. Как я могу создать свой собственный магазин?
- 6. Как я могу настроить свой собственный SVN
- 7. Как я могу создать свой собственный UITabBar?
- 8. Как я могу использовать свой собственный shuffle
- 9. Как я могу создать свой собственный ActionBar?
- 10. Как я могу подключить свой собственный класс?
- 11. Как я могу реализовать свой собственный MFMailComposeView?
- 12. Где я могу разместить свой значок?
- 13. Как я могу MySQL использовать собственный сайт?
- 14. Как я могу правильно отображать свой сайт?
- 15. Как я могу загрузить свой сайт?
- 16. Как я могу изменить свой сайт asp.net?
- 17. Как разместить свой сайт в сети LAN
- 18. Где я должен разместить свой собственный «модуль» в приложении rails?
- 19. Могу ли я изменить свой собственный заголовок?
- 20. Где я могу разместить свой список?
- 21. Где я могу разместить свой json-файл
- 22. Где я могу разместить свой веб-сервис?
- 23. Как я могу добавить свой собственный файл javascript в wordpress?
- 24. Могу ли я использовать свой собственный сайт, чтобы показать свой плейлист и видеоплеер youtube?
- 25. Как работают глификоны? Как я могу сделать свой собственный?
- 26. Я не могу запустить свой сайт
- 27. Могу ли я использовать свой собственный домен с c9.io?
- 28. Могу ли я установить свой собственный сертификат в моем магазине?
- 29. Как я могу добавить свой собственный XML-запрос в SoapObject?
- 30. как я могу создать свой собственный плагин для брокера москитов?
wget - это самое простое и экономичное решение поставленного вопроса. Для периодического сканирования и т. Д., Или вы хотите использовать кувалду, чтобы взломать орех, посмотрите на Apache Nutch - http://nutch.apache.org/ – dnshio
Я не слышал об этом раньше (im a newbiew im боюсь). Как запустить команду wget и откуда? – Ruf1
Выполнить из оболочки или использовать php exec – exussum