2015-12-17 4 views
2

Я пытаюсь классифицировать элементы в основных категориях, поддерживаемых Wikidata: Generic, Person, Organization, Events, Works, Terms, Place, Others. Эти категории перечислены здесь: https://www.wikidata.org/wiki/Wikidata:List_of_propertiesКак классифицировать элементы Wikidata?

Не удалось найти объект, который задает основную категорию. Я посмотрел в P31 «экземпляр» свойства и подкласс «P279», но они не то, что мне нужно.

Например, для «IBM» P31 возвращает «открытую компанию» и «дом программного обеспечения», а для «Swiss International Air Lines» возвращает «авиакомпанию». Так что я не могу сказать, что они оба организаций.

Есть ли способ сделать это?

Одним из вариантов было бы проверить свойства предмета, поэтому , если у предмета есть «секс или пол» P21, тогда это человек (или животное). Но я не думаю, что это стабильно, поскольку свойство не является обязательным.

Я использую Wikidata Toolkit для своих запросов.

+0

Человек человек, также может работать (с набором организаций) –

ответ

5

Wikidata имел обыкновение иметь свойство основного типа, но оно было удалено в пользу экземпляра и более гибкой схемы. Вы можете увидеть много архивированного обсуждение основного типа на https://www.wikidata.org/wiki/Property_talk:P107

Вы, вероятно, хотите взглянуть на конечной точке SPARQL на http://query.wikidata.org

Q4830453 это коммерческое предприятие/компания. Чтобы найти все элементы, которые компания или подкласс компании просто сделать:

PREFIX wd: <http://www.wikidata.org/entity/> 
PREFIX wdt: <http://www.wikidata.org/prop/direct/> 

SELECT DISTINCT ?item 
WHERE { 
    ?item wdt:P31/wdt:P279* wd:Q4830453 
} 

Запроса занимает немного времени, в настоящее время существует 150K результатов.

Смежные вопросы