2017-01-12 3 views
0

Я хочу импортировать файл GML (графический файл) из hadoop в neo4j, для этого мне нужно установить соединение между hadoop и neo4j, я проверил сайт neo4j, но ничего не нашел: https://neo4j.com/developer/apache-hadoop/ это то, что они говорят, что для связи между Hadoop и Neo4j:connect hadoop to neo4j

в прошлом были некоторые подходы, используемые Hadoop быстро генерировать `Neo4j датасторы непосредственно. Хотя этот подход имеет значение , он также тесно связан с форматом магазина определенной версии Neo4j, так как он должен дублировать функциональность , записывая разделяемые файлы-хранилища. С помощью параллельного инструмента neo4j-import и API, представленных в Neo4j 2.2, такое решение больше не требуется. Импортные возможности масштабируются по большому количеству процессоров, чтобы максимизировать производительность импорта .

Может ли кто-нибудь объяснить мне, что это значит? спасибо

ответ

1

Возможно, я не понимаю, что вы пытаетесь выполнить, но если у вас есть файл GraphML, вам не нужно подключение к hadoop, просто скопируйте файл в экземпляр Neo4j или подайте его через Интернет.

Импорт GraphML доступен в Neo4j с использованием apoc.import.graphml procedure. Например:

CALL apoc.import.graphml("graph.gml", {batchSize: 10000, readLabels: true, storeNodeIds: false, defaultRelationshipType:"RELATED"};