У меня есть требование в hadoop, где мне нужно загрузить набор файлов журналов в таблицу hive и запросить на нем.Загрузка LOG FILE В HIVE ТАБЛИЦА
Файл журнала Sample выглядит,
# Comment
# Comment
01 record1 record2 record3 record4
02 record1 record2 record3 record4
03 record1 record2 record3 record4
# Comment
# comment
Я хочу, чтобы устранить эту # строку комментария, которая начинается с # в каждой строке.
Фактический контент, который я хочу загрузить, ограничен пространством и структурирован.
Любое решение/предложение о том, как загрузить данные, исключив строки комментариев?
Пожалуйста, помогите!