2012-06-04 3 views
0

Я пытаюсь извлечь ссылки на все изображения в википедии, не теряя имен изображений и, вероятно, тегов alt. Я познакомился сПолучение ссылок на изображения википедии

How do I get link to an image on wikipedia from the infobox?

, что я мог бы получить его с помощью запроса: http://en.wikipedia.org/wiki/File:filename.jpg Однако, чтобы сделать это мне нужно, чтобы получить все имена файлов изображений. Любые подсказки?

Спасибо!

+0

У меня есть рабочее свободное основание, чтобы получить меня изображения с помощью GUID, однако определенный Темы в freebase не имеют изображений. Итак, это проблема, в отличие от википедии. – madCode

+0

Я думаю, что это поможет .. http://wiki.freebase.com/wiki/WEX/Documentation# Таблицы просто читают его! – madCode

+0

Вам нужны изображения на данной странице? Изображения в инфобоксах на данной странице? Все изображения в Википедии? – Tgr

ответ

3

это дает список все URL изображений и имена файлов также на странице

http://en.wikipedia.org/w/api.php?action=query&titles=World&generator=images&gimlimit=10&prop=imageinfo&iiprop=url|dimensions|mime&format=json 

изменить название = часть

+1

Почему это не дает мне релевантных результатов? Попробуйте. Title = google – madCode

+0

У вас была проблема? Почему так много изображений бесполезно? – sparkle

+0

@madCode https://en.wikipedia.org/w/api.php?action=query&titles=google&generator=images&gimlimit=10&prop=imageinfo&iiprop=url|dimensions|mime&format=json, похоже, отлично работает –