Разделить задачу на 3 файла.
- файл для получения списка страниц и в качестве основного сценария (поставить на кронтабе) (main.php)
- для анализа фактической страницы. (parse.php)
- некоторый сценарий оболочки для обработки вашего второго скрипта.
Затем в своем 1-ом файле, сделать что-то вроде этого:
<?php
$pagelist = get_page_list();//this will retrieve page list using CURL and save each page to some, let's say pagelist.txt and return this absolute path.
exec("/path/to/php /your/3rdscript.sh < $pagelist");
?>
И вот ваш третий файл:
#!/bin/bash
while read line
do
/path/to/php /path/to/your/2ndscript.php -f $line &
done
Пожалуйста, обратите внимание, что на 3-й сценарий (скрипт оболочки) I использование & (амперсанд). Это скажет оболочке о том, что этот конкретный процесс перейдет в фоновый процесс.
На Вашем 2 сценария, вы можете использовать что-то вроде этого:
<?php
$pageurl = $argv[2];
//do your curl process to fetch page $pageurl here
Используя шаг выше, вы можете ускорить путем выборки нескольких страниц одновременно.
спасибо, я посмотрю и посмотрю, соответствует ли это моим потребностям. Вы используете это? – embedded