2013-03-12 2 views
1

Мне нужен набор данных для проекта, который имеет приличное количество (около миллиона) RDF троек. Я нашел множество наборов данных в сети, но все они имели данные в тройках в форме URI. Мне нужен набор данных, где данные полностью в форме строковых литералов.rdf triple dataset

Мне нужны данные в этом формате.

person1,isNamed ,‘Serge Abiteboul’ 
person2,isNamed ,‘Rick Hull’ 
person3,isNamed ,‘Victor Vianu’ 

У меня очень мало или совсем нет идеи о том, что такое RDF и как работать с ним. Так может кто-то, пожалуйста, помогите мне в том, как получить данные в этом формате или если есть способ конвертировать данные из URI в строковые литералы.

ответ

3

У вас не может иметь тройку RDF, которая состоит только из строковых литералов.

RDF triple состоит из предмета, предиката и объекта. Субъекты и предикаты всегда являются URI. Объектами могут быть URI или (строковые) литералы. (Объекты и объекты также могут быть пустыми узлами.)

Для описания данных в RDF вам нужны URI, которые представляют вещи/понятия/отношения.

См. http://www.w3.org/TR/rdf-concepts/.


Для примера можно использовать популярный FOAF словарный запас. В Turtle syntax это может выглядеть следующим образом:

<http://example.com/team/person1#me> <http://xmlns.com/foaf/0.1/name> "Serge Abiteboul" . 
  • Здесь URI http://example.com/team/person1#me (= предмет) будет представлять реальную личность (вместо страницы об этом лице). Если такого URI нет, вы можете создать его самостоятельно в своем собственном домене (словарь FOAF имеет различные классы и свойства для описания людей).
  • http://xmlns.com/foaf/0.1/name Ури (= сказуемого) находится в FOAF словаре defined:

    name - Имя для каких-то вещей.

    [...]

    name что-то простая текстовая струна.

  • "Serge Abiteboul" (= object) является строковым литералом.

Тип данных литералов объекта может быть указан XML Schema, например. "-5.0"^^xsd:decimal для десятичного числа. Можно также указать язык литеральных строк объекта, например. "house"@en для английской строки.


Конечно, вы могли бы использовать префиксы вместо того, чтобы использовать в полной мере Юрис все время (но в конце концов он все равно будет URIs):

@prefix foaf: <http://xmlns.com/foaf/0.1/> . 
@prefix ex: <http://example.com/team/> . 

ex:person1#me foaf:name "Serge Abiteboul" . 

Так что, если вы хотите модель данных в RDF, вы должны

  • найти (или создать) идентификаторы URI для абстрактных вещей, которые вы хотите, чтобы описать, и
  • найти (или создать) словари/онтологии, которые определяют классы и свойства (в форме URI) для описания абстрактных вещей и их отношений.

Некоторые популярные словари:

Для лиц и социальных сетей, см FOAF. Для онлайн-сообществ см. SIOC. Для авторства и метаданных документа см. Dublin Core. Для иерархии классов см. RDFS и SKOS. Для продуктов см. GoodRelations. Для программных проектов см. DOAP. And so on.

Смежные вопросы