спросил О.П.,
Этот аспект аудита фактически используется в корпоративных средах? Крупные компании используют его в своих проектах datawarehouse?
Короткий ответ: да, иногда
Длинные ответ, размер аудита используется, когда это действительно необходимо. Размеры аудита должны хранить данные метаданных ETL. И некоторые из этих метаданных могут быть непосредственно сохранены на самом деле таблица. Такие данные, как load date
, loading batch number
, job name
, user name
и т. Д., Вы можете сразу сохранить в своей таблице фактов.
Но на самом деле, когда вы решите сохранить эту информацию на самом деле, вы скоро поймете, что многие из этих информации на самом деле будут одинаковыми для большого количества записей таблицы фактов.
Например, если вы загружаете 100K записей в вашей таблице фактов в день loading job name
, source file name
, user who executed the job
, batch number
и т.д. будут одинаковыми для всех этих 100K записей. Таким образом, имеет смысл, если вы удалите эту информацию из своей таблицы фактов и сохраните ее в отдельной таблице и отправьте surrogate key
этой отдельной таблицы вашему факту. Это уменьшает избыточность данных, потребность в пространстве и может повысить скорость загрузки. Нормальные данные нормализация техники, вы знаете.
Конечно, есть информация, которую вы должны указать , а не. Скажем, load date-time
записей. Это будет уникально для всех записей в вашем факте - поэтому, очевидно, если вы хотите разместить эту информацию в своем измерении аудита, ваша таблица аудита будет такой же большой, как ваш факт. Вместо этого вы должны поместить такую информацию в свою таблицу фактов.
Я лично видел/работал на некоторых крупнейших в мире хранилищах данных в секторе розничной торговли и телекоммуникаций и стал свидетелем какого-то измерения аудита в этих хранилищах данных.
Спасибо за информацию! – carexcer