2016-08-26 4 views
0

Я использую кластеры HDInsight Spark на Azure, а Jupyter не может добавлять внешние зависимости. Пытались это:Как добавить внешние зависимости от HDInsight Jupyter?

enter image description here

Однако, если я намеренное ошибку:

%%configure 
{ "packages":["com.websudos:phantom_2.10:1.27.111111111111"] } 

Так это пытается решить пакеты, просто не загружая их?

enter image description here Есть ли другой способ заставить эту работу работать?

ответ

1

пакет, который вы используете не тот. Умышленная ошибка на самом деле говорит вам, что она не может разрешить этот пакет.

Кажется, что пакет, который вы действительно можете использовать, это com.websudos:phantom-spark, так как это то, на что они построили поддержку Spark? Link

%%configure -f 
{ "packages":["com.websudos:phantom-spark_2.10:1.8.0"] } 

, а затем вы можете импортировать

import com.websudos.phantom.spark._ 

Однако, если то, что вы хотите, это разъем искровой Cassandra, то datastax connector, кажется, один в использовании.

Должен сказать, что я никогда раньше не использовал Спарк с Кассандрой, поэтому, пожалуйста, следуйте инструкциям в Интернете о том, как их настроить.

+0

Это то, что я понял, а фантом не поддерживает распространение кода в искры, и только те пакеты не работают на jupyter (работает, если я их испрошу). Фантомная искра не является открытым исходным кодом AFAIK. И да, spark-cassandra-connector полезен для хранения данных, но я хотел использовать счетчики cassandra для некоторых пользовательских вещей, во всяком случае, спасибо! – ixaxaar

+0

Можете ли вы поделиться командой spark-submit, которую вы выполняете, что работает, и кодом, который доказывает, что он работает? – aggFTW

+0

Извините, не могу. Перемещено в AWS. – ixaxaar

Смежные вопросы