2013-06-11 7 views
2

Используя базовую звездную схему, мне сказали, что таблица фактов будет иметь по крайней мере количество строк, равное произведению числа строк в каждом измерении.Понимание таблиц фактов в хранилищах данных

Например, 3 продукта, 5 рекламных акций и 10 магазинов означают, что таблица фактов должна иметь не менее 150 записей, независимо от того, где или нет продукт, на самом деле каждый рекламный пакет или существует в каждом магазине. В частности, нулевые значения будут существовать там, где, например, у продукта нет конкретной рекламы и т. Д.

Может кто-то, пожалуйста, предоставить академический источник, который поддерживает или, по крайней мере, просто подтвердите эту идею.

Причина, по которой я прошу об этом, заключается в том, что мое понимание говорит мне, что это создало бы МАССИВНОЕ количество бесполезных данных в таблице фактов.

Спасибо!

+0

Глупости, читайте книги Кимбалла - они хорошо написаны и просты. –

+0

Привет, спасибо за ответ. См. Сообщение ниже. – Luke

ответ

0

Конечно нет. Я предлагаю вам попросить вашего источника разъяснить это утверждение, похоже, что здесь где-то есть недоразумение.

А что, если вы добавите измерение времени ..? Также не возможно иметь нулевые значения в качестве ключей, в которых отсутствуют рекламные акции, потому что причина для ключа заключается в том, чтобы указать размерное значение, значение которого не выполняется.

Величины измерения для поддержки любых фактов, которые у вас есть, а не наоборот.

+0

Привет, спасибо за ответ. См. Сообщение ниже. – Luke

1

привет спасибо за ответы. Я посоветовался с моим лектором, и он действительно нашел ссылку на страницу для меня: «... Примите очень упрощенный пример из 3 продуктов, 5 клиентов, 30 дней и 10 торговых представителей, представленных в виде строк в таблицах размеров. Даже в этом примере, количество строк таблицы фактов будет 4500, очень большое по сравнению с строками таблицы размеров ... »(Ponniah, P., 2009. Хранилище данных: Основы для ИТ-специалистов, 2-е издание. John Wiley & Sons, Inc., Нью-Джерси, стр. 237)

Однако автор далее говорит, что: «Мы сказали, что одна строка таблицы фактов относится к определенному продукту, конкретной дате календаря, конкретному клиенту и Другими словами, для конкретного продукта, конкретной даты календаря, конкретного клиента и отдельного торгового представителя есть соответствующая строка в таблицу фактов. Что происходит, когда дата представляет собой закрытый отпуск, и никакие заказы не принимаются и не обрабатываются? Строки таблицы фактов для таких дат не будут иметь значений для мер. Также могут быть другие комбинации атрибутов таблицы размеров, значения, для которых строки таблицы фактов будут иметь нулевые меры. Нужно ли хранить такие строки с нулевыми мерами в таблице фактов? В этом нет необходимости. Поэтому важно, чтобы реализовать этот тип разреженных данных и понять, что таблица фактов может иметь пробелы.»

Короче говоря, вы, ребята, кажется, правильно, спасибо!

+0

Надеюсь, ваш лектор не считает, что каждый клиент покупает каждый продукт каждый день у каждого торгового представителя. Строки таблицы фактов обычно не существуют, когда нет фактов (например, продажи) для записи. –

+0

@ David Довольно странно, я думаю, что пример моментального снимка, который использует Кимбалл в одной из его книг, - это почти то, что вы описали: хранилище CRM, где каждый день заполняется каждый клиент, независимо от того, завершил ли клиент транзакцию , Как и в том, что говорит мистер Кимбалл, я отношусь к этому с хорошей дозой скептицизма и осторожности. – sqlvogel

+0

@ Давид, на самом деле, мой лектор сделал ... но я возьму его с щепоткой соли. По-видимому, его значение становится очевидным при сборе данных в следующем семестре – Luke

0

Это может относиться к конкретному виду таблица фактов:.. шаблон, что Ральф Кимбалл термины в периодического снимка таблице фактов То есть, где таблица фактов повторяет все население строк для каждой точки во время ИМА полезность такого подхода является крайне ограниченным

а. В таблице фактов моментальных снимков неявно требуется, чтобы таблица фактов являлась продуктом ее измерений, но она представляет потенциальную проблему w Предпочитаете правильную популяцию каждого моментального снимка. Перекрестное произведение размеров - это один из способов сделать это, я полагаю.

Смежные вопросы