2013-04-27 3 views
0

Я борюсь с Вики Апи. Как я могу просто получить html страниц с помощью API. Я знаю, что это возможно, поскольку я делал это раньше, но я не помню, как это сделать.Как я могу получить Html источник страницы Викисловарь?

Скажите, что мне нужен источник страницы для страницы http://en.wiktionary.org/wiki/bicycle, как это сделать. Какой API я использую. Я не хочу смотреть в браузере?

+0

В браузере нажмите 'Ctrl' +' U'. Если вы не используете браузер, что вы тогда используете? – Bergi

+0

Я хотел бы использовать Java. Эссенциально есть URL, который я могу напечатать, который отобразит источник страницы, если он введен в браузере. Если я создам URL-адрес в JAVA, он получит источник страницы. – KennyBartMan

+0

URL-адрес сам по себе является запросом somesort. – KennyBartMan

ответ

1

С Java и Jsoup вы можете сделать это:

Document document = Jsoup 
     .connect("http://en.wiktionary.org/wiki/bicycle") 
     .get(); 

Element bodyContent = document.select("div#bodyContent").first(); 

System.out.println(bodyContent.html()); 
0

Вы можете использовать действие "разбора" в API MediaWiki если вы хотите HTML:

http://en.wiktionary.org/w/api.php?action=parse&page=bicycle&prop=text&disablepp=1&format=json

Если вы искали для оригинального wikitext вы просто запрашиваете другое свойство:

http://en.wiktionary.org/w/api.php?action=parse&page=bicycle&prop=wikitext&disablepp=1&format=json

Смежные вопросы