2015-03-02 4 views
0

Я занимаюсь исследовательским проектом, и для этого мне нужно получить результаты почти для 1,5 миллионов запросов.Запросить Запросы Программно

Может ли кто-нибудь предложить, как я могу его достичь? Если это помогает, мне нужны результаты только с определенного сайта.

Я видел, что все поисковые системы предоставляют API, но я не думаю, что у кого-то есть свободный лимит, который мог бы обрабатывать миллионы запросов.

Любое предложение будет оценено

ответ

0

Вы можете сканировать веб-сайт и использовать свой собственный поисковик, чтобы запросить его. Вы можете использовать Apache Lucene, например, в качестве библиотеки с открытым исходным кодом, которая обеспечивает функциональность «поисковой системы». Вам нужно будет создать документ для каждой страницы и подать его в IndexWriter, а затем запросить свой индекс.

Альтернативой является использование API paid, предоставляемого поисковыми системами, что позволяет значительно увеличить количество запросов.

+0

Любое предложение о том, как сканировать веб-сайт? –

+0

@Coder Hacker как о запуске dfs/bfs на элементах ссылок (проанализированный html), который указывает на тот же сайт;> – fex

+0

@fex Я решил, что должен был это сделать! Я надеялся, что кто-то где-нибудь сохранит все страницы с публичной индексацией. –

Смежные вопросы