create table n_data(MARKET string,CATEGORY string,D map<string,string>,monthid int,value DOUBLE)
STORED AS ORC
;
загружаю в него данные (более 45 миллионов строк), посмотреть на улей складHive разбивает ORC файлы на мелкие части
Результат таблица состоит из 5 файлов с размером 10MB-20MB, но dfs.block.size устанавливает в 128 МБ, это не оптимально для хранения небольших файлов, потому что он использует весь блок!
Как настроить файлы с разделяемым доступом на диск на 128 МБ?
EDIT вставки запроса:
insert into n_data
select tmp.market,tmp.category,d,adTable.monthid,tmp.factperiod[adTable.monthid] as fact
from (select market,category,d,factperiod,map_keys(factperiod) as month_arr from n_src where market is not null) as tmp
LATERAL VIEW explode(month_arr) adTable AS monthid
Как вы вставляете записи, показываете инструкцию insert. У вас есть другое свойство, связанное с настройками улья? – Ambrish
@ Добавить комментарий Вставить вопрос в вопрос – rpc1
@Ambrish Нет У меня нет других связанных с настройками улья – rpc1