2015-11-21 2 views
0

Я хочу получить страницы в Википедии как текст.Как получить содержание Википедии как текст API?

Я посмотрел на API Википедии здесь https://en.wikipedia.org/w/api.php, который говорит, что для того, чтобы получить страницы как текст мне нужно, чтобы добавить это к странице по адресу:

api.php?action=query&meta=siteinfo&siprop=namespaces&format=txt 

Однако, когда я пытаюсь добавив суффикс к адрес нормальной страницы, страница не найдена:

https://en.wikipedia.org/wiki/George_Washington/api.php?action=query&meta=siteinfo&siprop=namespaces&format=txt 

Следуя инструкциям из Get Text Content from mediawiki page via API, я попытался adding /api.php?action=parse&page=test до конца строки запроса. Поэтому я получил это:

https://en.wikipedia.org/wiki/George_Washington/api.php?action=parse&page=test 

Однако это также не работает.

+1

Возможный дубликат [Получить текстовое содержание из Mediawiki страницы с помощью API] (http://stackoverflow.com/questions/1625162/get-text-content-from- mediawiki-page-via-api) – Zulu

+0

Извините, что спросила, но действительно ли вы прочитали инструкции, с которыми вы связались? – leo

ответ

1

Вы должны использовать некоторые из these formats: json, jsonfm, none, php, phpfm, rawfm, xml или xmlfm, так txt не допустимый формат. Кроме того, ваша ссылка API неправильно, используйте:

https://en.wikipedia.org/w/api.php?action=query&titles=George_Washington&prop=revisions&rvprop=content&format=xml 
Смежные вопросы