Мы начали разработку процесса обнаружения изменений в нашей базе данных ERP для создания баз данных datawarehouse. Поскольку им не нравится размещать триггеры в базах данных ERP или даже включить CDC (сервер sql), мы думаем, что читаем изменения из баз данных, которые реплицируются в центральный репозиторий посредством репликации транзакций, а затем имеют дополнительную копию, которая объединит (у нас будет CDC на дополнительной копии) ...Datawarehousing, важно ли отслеживать исторические данные (SQL Server)?
Интересно, есть ли возможность, когда данные, которые изменяются внутри, скажем, 15 минут, достаточно важны, чтобы рассмотреть изменение в нашем дизайне, как мы план при проектировании это не сможет отслеживать каждое изменение, оно будет получать только самое позднее через некоторое время, например, если значение в строке изменяется от А до В, а затем через 1 минуту изменяется от В до C система репликации приведёт это последнее значение к центральному репозиторию, затем мы объединим таблицу с нашей дополнительной копией (эта дополнительная копия могла иметь значение A, а затем w плохо обновляется с помощью C, и мы потеряли значение B).
Есть ли хороший сценарий в базе данных хранилища данных, где вам нужно отслеживать ВСЕ изменения, которые прошла таблица?
Вам необходимо отслеживать столько изменений, сколько было бы актуально для пользователя данных. Отслеживание изменений распространено в хранилищах данных. Если вы не знакомы с медленно меняющимися размерами (http://www.kimballgroup.com/2008/08/21/slowly-changing-dimensions), я предлагаю вам ознакомиться с ними. – mmarie
Что хотят ваши пользователи? Что это за источник? Если это финансовые показатели, я сомневаюсь, что кто-то будет интересоваться значением B. Если его мониторинг в реальном времени, то этот пункт данных может быть очень важен. –