Я использую Hive для запроса данных, которые у меня есть. Проблема в том, что эти данные необходимо очистить, и для меня это слишком сложно, чтобы попытаться обработать его на моем компьютере (следовательно, используя Hadoop и Hive). Есть ли способ сделать это с Улей? Я смотрел на пользовательские функции, но я понимаю, что они работают по строкам, поэтому не может быть оптимальным способом очистки данных.Очистка больших данных с помощью Hive
Благодаря
Спасибо за ответ мне. Я закончил использование потоковой передачи для очистки данных –