Я ищу варианты для базы данных графа, которые будут использоваться в проекте. Я ожидаю, что ~ 100000 пишет (vertix + edge) в день. И гораздо меньше читает (несколько раз в час). Самый частый запрос занимает 2 трассировки глубины ребер, которые я ожидаю вернуть ~ 10-20 результирующих узлов. У меня нет опыта работы с графическими базами данных и вы хотите работать с gremlin, чтобы иметь возможность переключиться на другую графическую базу данных, если это необходимо. Теперь я рассматриваю две возможности: neo4j и Titan.Нужна помощь в выборе базы данных графа
Как я вижу, для Neo4j достаточно сообщества, информации и инструментов, поэтому я бы предпочел начать с него. Их количество должно быть достаточным для наших нужд (~ 34 миллиарда узлов, ~ 34 миллиарда краев). Но я не уверен, какие аппаратные требования мне придется решать в этом случае. Также я не видел вариантов параллелизации для их запросов.
С другой стороны, Titan построен для горизонтальной масштабируемости и имеет интеграцию с интенсивно параллельными инструментами, такими как искра. Поэтому я могу ожидать, что аппаратные требования могут масштабироваться линейным образом. Но для Titan гораздо меньше информации/сообщества/инструментов.
Я буду рад услышать ваши предложения
Благодарим за ответ. Можете ли вы добавить что-то относительно требований к оборудованию и экономичности для предоставленного варианта использования? –
@OlgaGorun Посмотрите здесь цены Neo4j http://neo4j.com/subscriptions/. Для Titan/DynamoDB, посмотрите здесь http://tinyurl.com/gpv9t43 –