Есть ли какой-либо Serde для поддержки таблицы hive с символами Unicode. У нас может быть файл в UTF-8, UTF-18 и UTF-32. Это не что иное, как мы ищем поддержку разных языков, таких как японский, китайский в таблице hive. Мы должны иметь возможность загружать разные языковые данные в таблицу hiveУлива, поддерживающая символы Unicode
0
A
ответ
0
Hive может читать и писать текстовые файлы UTF-8.
для другого набора символов, он должен быть преобразован в UTF-8.
Синтаксис для преобразования является
hive> CREATE TABLE mytable(name, datatype) ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' WITH SERDEPROPERTIES("serialization.encoding"='FORMAT');
преобразование может быть сделано с помощью Iconv, но он поддерживает только файлы меньше, чем 16G. синтаксис:
>iconv -f encoding -t encoding inputfile
Смежные вопросы
- 1. Несогласованный Unicode Emoji Символы/Символы
- 2. C# строка, не поддерживающая кириллические символы
- 3. C# Unicode (японские символы)
- 4. python заменить символы Unicode
- 5. matplotlib и символы Unicode
- 6. HTML - Отсутствующие символы Unicode
- 7. Unicode символы в Затмении
- 8. Символы Unicode сохраняются некорректно
- 9. Символы Unicode не соответствуют
- 10. Android Unicode Гендерные символы
- 11. Существуют ли символы Unicode?
- 12. Преобразование unicode в символы
- 13. Незаконные символы Unicode
- 14. GSON - используйте символы Unicode
- 15. Инициализировать символы Unicode динамически
- 16. UILabel, отображающий символы Unicode
- 17. символы unicode в html
- 18. jQuery и символы Unicode
- 19. Unicode символы в XeLatex
- 20. Символы Unicode не работают
- 21. printf() Расширенные символы Unicode?
- 22. кодировать символы Unicode в escape-последовательности unicode
- 23. Поддерживает ли MigraDoc национальные символы/символы Unicode?
- 24. Mono WinForms и символы Unicode
- 25. Анализ: Как отключить символы Unicode?
- 26. Отправить символы Unicode через MultipartEntity
- 27. символы Finding Unicode от объекта
- 28. MSBuild, NAnt и символы Unicode
- 29. Нечетные символы в строке Unicode
- 30. символы unicode antlr3 вызывают ошибку