2014-11-04 5 views
0

Я использую API поиска костюмов Google. Проблема в том, что я вижу некоторые несоответствия между результатами API Google и результатами прямого поиска. Например, когда я ищу Android из API, он говорит:Результаты прямого поиска и API поиска Google не соответствуют

.... 
"request": [ 
    { 
    "title": "Google Custom Search - Android", 
    "totalResults": "16600000", 
    "searchTerms": "Android", 
    "count": 10, 
    "startIndex": 1, 
    "inputEncoding": "utf8", 
    "outputEncoding": "utf8", 
    "safe": "off", 
    "cx": "013036536707430787589:_pqjad5hr1a" 
    } 
    ] 
}, 
... 

, в котором указаны результаты «16600000». Но когда я ищу Android напрямую, это дает мне «около 1 010 000 000» результатов. И в некоторых случаях эта несогласованность намного больше. Какова причина? Есть идеи?

Я понимаю, что API и основные поисковые системы могут работать с различными компонентами. Но эта разница кажется огромной. Мне любопытно, если это так.

ответ

2

Я просто сделал тот же поиск, и итоговые результаты вышли как «877 000 000», который не соответствует ни одному из номеров, которые вы предоставили.

Число результатов - это оценка - и очень часто очень неточная. Это неизбежно из-за того, что инвертированные индексы создаются в поисковых системах. Из-за их огромного размера инвертированные индексы разделяются на очень большое количество ведер. Запрос только достаточно «глубоко» попадает в инвертированный индекс, чтобы получить первые 1000 наивысших результатов, которые отображаются пользователю. Затем производится оценка количества результатов в общем индексе на основе подмножества, которое было получено для запроса.

Также обратите внимание, что результаты для большинства запросов кэшируются с использованием очень широкой сети серверов. Это означает, что вы можете получить другую оценку общего количества результатов, исходя из того, какой сервер вы попали в ваш запрос. Другими словами, два пользователя, которые выполняют один и тот же поиск одновременно, могут видеть разные списки результатов с разными оценками для общего количества результатов.

Смежные вопросы