2012-06-28 5 views
0

Я в процессе создания метапоиска, и я застрял! Используя php, я отправляю запрос в 3 поисковых системы и вытаскиваю 10 лучших URL-адресов из каждого. Затем я сохраняю эти URL-адреса в массиве 2d с соответствующим счетом для целей агрегации, т.е. 1-ый результат получает 20pts, второй получает 18pts и т.д.metasearch aggregation in php

так в следующем примере я запрос в поисковых системах с 'PHP' и получить эти результаты:

BLOCKQUOTE

Blekko

Array ([URL] => php.about.com/ [оценка] => 20) Array ([URL] => php.net/ [SCORE] => 18) rray ([url] => en.wikipedia.org/wiki/PHP [score] => 16) Array ([url] => www.phpbuilder.com/ [score] => 14) Array ([url] = > blekko.com/ws/http://php.about.com/+/seo [score] => 12) Array ([url] => www.w3schools.com/php/default.asp [оценка] => 10) Array ([url] => phpnuke.org/ [score] => 8) Array ([url] => www.symfony-project.org/ [score] => 6) Array ([url] ] => www.phpconference.co.uk/ [оценка] => 4)

Entireweb

Array ([URL] => phpnuke.org/ [оценка] => 20) Array ([url] => www.aardvarktopsitesphp.com/ [score] => 18) Array ([url] => www.php.net/ [score] => 16) Array ([url] => www.php.net/downloads .php [score] => 14) Array ([url] => php.net/manual [score] => 12) Array ([url] => www.php.net/manual/en/ [оценка] => 10) Массив ([url] => www.php.net/docs.php [оценка] => 8) Массив ([url] => www.php.net/license/ [score] => 6) Array ([URL] => www.phplinkdirectory.com/ [оценка] => 4)

Bing

Array ([URL] => www.php.net/ [оценка] => 20) Массив ([url] => ru.wikipedia.org/wiki/PHP [score] => 18) Array ([url] => www.php.net/downloads.php [score] => 16) Массив ([url] => www.w3schools.com/php/default.asp [оценка] => 14) Массив ( [url] => windows.php.net/download [score] => 12) Массив ( [url] => windows.php.net/ [score] => 10) Array ([url] => www.tizag.com/phpT/ [score] => 8) Array ([url] = > wiki.php.net/ [score] => 6) Array ([url] => qa.php.net/ [score] => 4) Array ([url] => www.php.com/ [оценка] => 2)

Что я хотел бы сделать, это объединить все эти Результаты, удалить дубликаты URLs, но добавить баллы и создать новый список с агрегированным результатов, которые могли бы выглядеть примерно так:

Array ([URL] => www.php.net/ [оценка] => 54)

Array ([url] => en.wikipedia.орг/вики/РНР [оценка] => 34)

Array ([URL] => www.w3schools.com/php/default.asp [оценка] => 24)

т.д.

Я просто ищу наиболее эффективный способ добиться этого, любой совет будет очень оценен. Благодаря

ответ

0

1- Вы можете trim URLs после этого вы можете понять, что www.php.net и php.net один и тот же веб-сайт (также www.php.net и php.net/downloads.php одинаковы).

2- Дайте больше баллов для получения результатов от Bing. Вы знаете, что Bing - это самый семантический поисковый двигатель.

3- Вы можете поймать названия и сохранить их в массивах, это личная рекомендация.

+0

Спасибо за совет. Bing, безусловно, возвращает гораздо более релевантные результаты, чем цельный. Есть ли простой способ добавить целое число из одного массива 2d в массив другого 2d? Наверное, это поможет мне начать комбинировать результаты. – shanahobo86

Смежные вопросы