2014-12-10 3 views
0

Я хотел бы запросить два или три условия, чтобы найти их в записях Википедии. В частности, я пытаюсь выяснить, повторяются ли некоторые термины в первых абзацах (абстракции) между элементами. Может быть прямой или через dbpedia. СпасибоQuery wikipedia

+1

используя какой язык? Можете ли вы привести пример того, чего вы пытаетесь достичь? – leo

+0

Может быть в python или в SPARQL. Это пример другого пользователя stackoverflow: SELECT? Uri? Txt WHERE { ? Uri rdfs: label? Txt. ? Txt bif: содержит «Египет» и «Пирамида». } Проблема заключается в том, что он просто возвращает те ключевые слова, найденные на ярлыках catebory. Я хотел бы найти все документы, содержащие оба ключевых слова в тексте или абстракте. – Arie

ответ

2

С помощью Mediawiki API вы можете найти статьи, содержащие эти ключевые слова. Пробуйте документацию API:Search.

Для выполнения того, что вы хотите сделать, вам, вероятно, потребуется найти статьи, в которых есть эти ключевые слова, а затем проанализировать текст, чтобы проверить, находятся ли они в первых абзацах.

С этим:

?action=parse&page=Nicolas_Cage&prop=text&section=0 

вы можете получить HTML первой части страницы (см это post).