2015-09-25 2 views
1

Я работаю с dbpedia. В моей работе моя программа должна прочитать файл dbpedia json, например (http://dbpedia.org/data/Germany.json), и извлечь всю информацию в виде пары ключевых значений, такую ​​же, как и страница dbpedia (http://dbpedia.org/page/Germany). Но я столкнулся с некоторой проблемой. Например, если вы видите json-файл (пожалуйста, используйте некоторый json-просмотрщик, чтобы сделать его доступным для чтения.), Если я хочу получить язык (язык поиска в файле), вы увидите, что он находится в массиве json, поэтому i должны извлечь эту информацию из массива. С другой стороны, если вы ищете seeAlso, то вы обнаружите, что вам нужно идти на один уровень и находить информацию. Более того, на HTML-странице есть некоторая информация (http://dbpedia.org/page/Germany), но она не найдена в метаданных json файл (http://dbpedia.org/data/Germany.json). Например, «birthPlace» находится на странице html, но не в json-файле. Я полностью смущен, что, как я буду кодировать, который может читать и хранить (как отображение значения ключа) данных, как это видно на странице html.Каков правильный способ получить всю информацию с страницы dbpedia?

ответ

0

Данные DBpedia организованы ресурсом, где каждый «ресурс» - это страница в Википедии и (предположительно) вещь в реальном мире. На каждый ресурс ссылается URL. Файл JSON содержит целую кучу ресурсов (например, http://dbpedia.org/resource/Opel_Kadett_C), которые имеют некоторую ссылку с интересующим вас ресурсом, http://dbpedia.org/resource/Germany. Я думаю, что это должно включать всю информацию на http://dbpedia.org/page/Germany, но явно некоторые записи - например, db: Anja_Kling - отсутствуют. Я не уверен, почему это так, но это может быть ошибка. Если вы не получите лучшего ответа здесь, попробуйте отправить по электронной почте свои вопросы в список рассылки dbpedia-discussion по адресу https://lists.sourceforge.net/lists/listinfo/dbpedia-discussion. Надеюсь, это поможет!

Смежные вопросы