Каков правильный способ вставки DF в Hive Внутренняя таблица в режиме добавления. Кажется, мы можем напрямую написать DF в Hive, используя метод saveAsTable ИЛИ сохранить DF в таблице temp, а затем использовать запрос.Как вставить Spark DataFrame в Hive Внутренняя таблица?
df.write().mode("append").saveAsTable("tableName")
ИЛИ
df.registerTempTable("temptable")
sqlContext.sql("CREATE TABLE IF NOT EXISTS mytable as select * from temptable")
Будет ли второй подход добавить записи или перезаписи?
Есть ли другой способ эффективно написать DF для Hive Internal table?
Это зависит от того, как (тип) будет храниться ваши таблицы и где. – FaigB