2014-12-16 1 views
1

Я hav 1000 * .html файлов в пути HDFS, и я хочу создать таблицу HIVE с этими файлами. Но ниже запрос дайте мне строки с разделителями '\ n', а не полный контент html.Hive - Как загрузить полное содержимое html-файла в одну строку hive?

> create external table if not exist mydb.myhtmltable (
> body STRING) 
> STORED AS TEXTFILE 
> LOCATION '/user/hadoop/dataset/refhtml'; 

Как разместить полный html-контент в поле .body? Я хочу 1000 строк из 1000 html-файлов. Возможно ли это?

ответ

1

Добавить это:

LINES TERMINATED BY \789 

где +789 является восьмеричное представление символа Юникода вы хотите использовать.

так:

create external table if not exist mydb.myhtmltable (
body STRING) 
STORED AS TEXTFILE 
LINES TERMINATED BY \789 
LOCATION '/user/hadoop/dataset/refhtml'; 
+0

Спасибо javadba за ваш комментарий. Но \ 789 выдает такую ​​ошибку: FAILED: SemanticException 4:20 LINES TERMINATED Только поддерживает новую строку '\ n' прямо сейчас. Ошибка, обнаруженная рядом с токеном '' \ 789 '' В настоящий момент разрешен только '\ n'. Если вы предложите любой другой намек, пожалуйста, помогите мне :) Спасибо заранее. – Dorr

Смежные вопросы