Существует поисковый сайт, результаты поиска которого динамически генерируются javascript. Таким образом, пользователь вводит запрос, и сайт отображает содержимое на странице без обновления.Лучший способ захватить содержимое веб-сайта извне
Мне нужно получить программные результаты поиска (скажем, из программы Java или скрипта perl/python).
В идеале я могу запустить свою программу с 100 запросами в качестве пользовательских входов, а затем программа ударила бы по этому сайту с каждым запросом и выложила на экран все результаты поиска, возвращенные веб-сайтом.
Очевидная проблема заключается в том, что сайт находится в javasript вместо простого HTML, поэтому отправка URL-запроса и анализ результирующего вывода не будут работать (поскольку исходный код этой страницы всегда является просто ссылкой на различные файлы .js).
Учитывая приведенные выше условия, каковы мои варианты?
Практически все поисковые провайдеры имеют некоторые API-интерфейсы, но свободные накладывают некоторые ограничения на то, как часто вы можете искать, сколько раз в день и сколько результатов вы получаете. – akarnokd
Этот сайт не имеет API. И предположим, что нет никаких ограничений на то, сколько поисков я могу сделать и как часто. – Saobi
Можете ли вы рассказать о том, какой сайт вы хотите использовать для поиска? Если поиск - это локальный поиск, вы можете попросить публичного поставщика поиска API-поиска искать только на этом сайте. – akarnokd