2015-05-12 3 views
1

Hive поддерживает данные в формате unicode в таблице в соответствии с документацией о кустах.Unicode Поддержка данных в улье

создать таблицу с «строка» типа данных и снабдили Юникода данных в него, но когда я говорю select * from <tablename> я получаю значения нежелательной

create table unicode (data string); 
load data local inpath 'unicode.txt' into table unicode; 

Ниже выход выберите

Les caract�res accentu�s (Fran�ais) 

En donn�es nous avons confiance 

Donn�es, donn�es, partout 
et tous les noeuds �taient d�connect� 

Donn�es, donn�es, partout 
ni aucun bit � traiter 

Исходное содержание Аккумуляторы для автомобилей (Français)

En données nous avons confiance 

Données, données, partout 
et tous les noeuds étaient déconnecté 

Données, données, partout 
ni aucun bit à traiter 

может кто-нибудь предложить, что может быть проблемой?

ответ

0

Создать запрос таблицы в вашем случае создает таблицу с использованием стандартного улья serde i.e. simple lazy serde, этот serde не обрабатывает unicode.

Для обработки юникода вам необходимо определить таблицу с помощью других типов, таких как textinput или rcserde.

+0

Всякий раз, когда я устанавливаю таблицу hive, она хранится в виде файла последовательности или текстового файла, каждый раз, когда идет с ленивым серилазером, как я могу установить textinput или rcserde – user145610

0

Сохраните текстовый файл как кодировку UTF-8, а затем загрузите данные в таблицу улья. Другие типы кодирования не поддерживаются.

Смежные вопросы