есть набор данных в CSV-файл с форматомNeo4j нескончаемого медленный узла создания
"title"|year|"word"
"Into the Wild"|2007|"abandoned-bus"
"Into the Wild"|2007|"adolescence"
"Into the Wild"|2007|"adoption"
Этого файл имеет более чем уЮ линию.
У меня есть база данных, работающая на удаленном суперкомпьютере, который я подключаю с помощью туннеля ssh. Я создаю 2 индекса:
CREATE INDEX ON :MOVIE(title)
CREATE INDEX ON :KEYWORD(word)
Тогда я выполнить запрос:
USING PERIODIC COMMIT
LOAD CSV WITH HEADERS FROM "file:c:/Users/.../Data/rels.csv" AS csv
FIELDTERMINATOR '|'
MERGE (m:MOVIE {title:csv.title })
ON CREATE SET m.year = toInt(csv.year)
MERGE (k:KEYWORD {word:csv.word})
Через некоторое время, я не знаю, один час, информация о запросе выполнения исчезает или появляется неизвестная ошибка. Но когда я перехожу к localhost: 7474/webadmin в статистике, количество узлов увеличивается очень медленно - 5-8 узлов за 10 секунд.
Когда я выполнить запрос: (я могу, потому что нет хода запроса показан)
match (m)
return count(m)
есть около 79K узлов. Но счет увеличивается более 21 часа. И мне нужно создать около 1.2M узлов, а сделать примерно 4M отношений между ними. Когда я делаю базовые вычисления, создание узлов 1.2M будет продолжаться около 13 дней. И действительно не хочу знать, как долго будет длиться создание отношений 4M.
Что происходит? Как закрепить его? Что я могу сделать? Пожалуйста, помогите.
Примечание:
Я уже создал узлы видеосюжетов и ключевых слов в прошлом, и сделал это из отдельных CSV файлов, содержащих только видеосъемку или ключевые слова и сделал это без использования PERIODIC COMMIT, но выбраны вручную около 60K строк и казнены запрос на него. Но я удалил их все, чтобы сделать это в 2 запросах также с отношениями и без работы с делением файлов csv. Не могу представить, чтобы вручную делить файл 4M строк на 60K строк файлов.
Возможно, вы можете настроить периодическую фиксацию на 1000, а также поделиться своей конфигурацией neo4j-wrapper, особенно настройками размера кучи java. –
Что еще хуже, у меня нет доступа к ним, потому что эти файлы базы данных находятся на этом удаленный компьютер. Но я помню, что мой наставник задал им большие ценности, потому что этот компьютер должен делать это легко. Но где я могу настроить периодическую фиксацию? И я также думаю, что этот файл обертки не во всех версиях, я имею в виду, что в версии Windows такого файла нет, но в версии Linux он должен быть там. – Gondil
ИСПОЛЬЗОВАНИЕ ПЕРИОДИЧЕСКОЙ КОМИТЕТЫ 1000 LOAD CSV ... – albertoperdomo