Я пытаюсь перейти на страницу в Википедии в каждом городе США. Поскольку я не знаю фактического URL-адреса, я выполняю поиск и загружаю первый результат. URL подписи, чтобы сделать это:Как загрузить страницу википедии в Java
http://en.wikipedia.org/wiki/Special:Search?go=Go&search=New+York%2C+NY
Однако, он не получает ничего взамен, вот мой код:
String curWikiURL = "http://en.wikipedia.org/wiki/Special:Search?go=Go&search="+URLEncoder.encode("New York, NY", "UTF-8");;
Scanner scanner = null;
URLConnection connection = null;
connection = new URL(curWikiURL).openConnection();
scanner = new Scanner(connection.getInputStream());
scanner.useDelimiter("\\Z");
content = scanner.next();
Document doc = Jsoup.parse(content);
Это противоречит правилам Википедии для использования такие роботы-роботы. Скорее всего, вы скорее будете заблокированы. Если это не робот. – h22
Я просто пытаюсь прочитать его один раз, чтобы собрать некоторые данные, чтобы сделать исследование, поэтому нет никакого сканирования в Интернете. Это больше похоже на автоматизацию задачи, которую в противном случае я должен был бы сделать вручную. – Bill
Вам понадобится информация в HTML или использование JSON API может быть вариантом? –