Я бегу улей 2.1.1, hadoop 2.7.3 на Ubuntu 16.04.Улей 2.1.1 на искры - какую версию искры я должен использовать
Согласно Hive on Spark: Getting Started, это говорит
Install/build a compatible version. Hive root pom.xml's defines what version of Spark it was built/tested with.
Я проверил pom.xml, это показывает, что искра версия 1.6.0.
<spark.version>1.6.0</spark.version>
Hive on Spark: Getting Started Но также говорит, что
Prior to Spark 2.0.0: ./make-distribution.sh --name "hadoop2-without-hive" --tgz "-Pyarn,hadoop-provided,hadoop-2.4,parquet-provided"
Since Spark 2.0.0: ./dev/make-distribution.sh --name "hadoop2-without-hive" --tgz "-Pyarn,hadoop-provided,hadoop-2.7,parquet-provided"
Так что теперь я смущен, потому что я бегу Hadoop 2.7.3. Должен ли я переопределить мой хаос до 2,4?
Какую версию Spark следует использовать? 1.6.0 или 2.0.0?
Спасибо!
Я пробовал Spark 1.6.0, и он работает. Я проведу Spark 2.0.2, как вы предложили. –
Сообщите мне, если у вас возникнут какие-либо проблемы. –
@siddharthajain, не могли бы вы поделиться своими подробными инструкциями по настройке «Улей» на Spark? Я пытаюсь запустить Hive (2.1.1) на Spark (2.1.0), но не смог. Я запускаю Spark в автономном режиме и запускаю улей с командой: hive --auxpath $ HOME/Tools/spark-2.1.0-bin-hadoop2.7/jars /, набор улей с командами: set hive.execution.engine = искра; set spark.master = spark: //10.0.0.26: 7077; улей> набор spark.eventLog.enabled = true; улей> набор spark.eventLog.dir =/tmp/hive-shizhz/spark /; hive> set spark.executor.memory = 512m; улей> набор spark.serializer = org.apache.spark.serializer.KryoSerializer; – shizhz