Я новичок в файле ORC. Я прошел через многие блоги, но не понял ясного понимания. Пожалуйста, помогите и уточните ниже вопросов.Hadoop ORC файл - Как это работает - Как получить метаданные
Могу ли я получить схему из файла ORC? Я знаю, что в Авро может быть схема.
Как это на самом деле обеспечивает эволюцию схемы? Я знаю, что можно добавить несколько столбцов. Но как это сделать. Единственное, что я знаю, создавая файл orc, - это загрузка данных в таблицу hive, которая хранит данные в формате orc.
Как работает индекс файлов ORC? То, что я знаю, для каждого индекса полосы будет поддерживаться. Но поскольку файл не отсортирован, как он помогает искать данные в списке полос. Как это помогает в пропуске полос при поиске данных?
Поддерживается индекс для каждого столбца. Если да, то не собирается ли он потреблять больше памяти?
Как файл ORC с форматом столбцов может вписываться в таблицу hive, где значения каждого столбца хранятся вместе. тогда как таблица улов производится для записи записи по записи. Как оба будут соответствовать друг другу?