Я загрузил очень большой график в TItan 1.0.0 с помощью backend Cassandra 2.1.13. Я должен выполнить некоторые операции на графиках с помощью Spark.Как обработать большой график Titan, используя Spark
Например,
- Я хочу найти подграфы в очень большом графе с помощью Apache Spark
- Я хочу запустить кластерный (код машинного обучения) на графику, хранящейся в Titan и др.
В принципе, я буду применять некоторый алгоритм на TitanGraph используя Спарк (который я полагаю будет быстрее на большом графике)
Я могу найти какие-либо документы, касающиеся этого, как обрабатывать график , Является ли Spark правильным подходом к применению алгоритмов (машинное обучение) на большом графике? Какими должны быть мои следующие шаги? Как запустить код Spark на Titan? (Я не могу найти точные методы или функции, через которые я должен быть вставляя/с использованием кода Спарк?
Любая помощь приветствуется.