Я пытаюсь создать базу данных из тройки RDF dbpedia. У меня есть таблица Categories
, которая содержит все категории в Википедии. Чтобы сохранить категоризации, я создал таблицу с полями child
и parent
, оба внешних ключа - Categories
. Чтобы загрузить категории из NTriples IAM, используя следующий SQL-запросВикипедия График базы данных Вставка
INSERT INTO CatToCat (`child`, `parent`)
values((SELECT id FROM Categories WHERE BINARY identifier='Bar'),
(SELECT id FROM Categories WHERE BINARY identifier='Bar'));
Но вставку очень медленно .. вставка 2.5 миллиона отношений займет очень много времени .. есть лучший способ для оптимизации запроса, схем ??
Ваш вопрос для меня не имеет смысла. Вы говорите, что используете SQL для запроса NTriples, который не имеет большого смысла. Я предполагаю, что у вас уже есть данные, импортированные в базу данных SQL. Почему отчасти возникает вопрос? Вероятно, вам будет намного лучше помещать таблицу в RDF/Triple Store и использовать рассуждения, чтобы вывести отношения. – RobV
Я пытаюсь загрузить данные из NTriples в базу данных SQL. Мое приложение не требует всех данных RDF, например, предикатов. Я мог бы просто извлечь это прямо из википедии, но я думал, что быстрее будет загружаться с dbpedia nt dumps. Мне просто нужна иерархия категорий. Я думал, что triplestore может быть излишним, поскольку мне не нужно использовать SPARQL и тому подобное. – z33m
Какие индексы вы создали в таблице CatToCat? –