относительно новая для хранилищ данных данных, которые так голые со мной.Конструкция хранилища данных - строка измерения с несколькими атрибутами
Это не совсем то, что я делаю, но я чувствую, что это хороший пример:
Скажем, у меня есть таблица размера продукта, который подключается к моей ProductSales таблице фактов. Каждая строка в dimProduct содержит все соответствующие данные для одного продукта (код, имя, описание и т. Д.), И существует около миллиона продуктов.
Теперь у меня есть требование хранить товарные категории на складе. Каждый продукт имеет несколько категорий, в среднем по 5.
Я должен дублировать целые строки в разделе «Размеры продукта» для каждой категории, в которую входит продукт, или я должен сжечь мою текущую звездную схему с помощью параметра dimCategory и таблицы ссылок dimProductCategory между двумя?
Я боюсь, что если я сделаю первый, моя таблица измерений будет более чем в 5 раз больше, и если я сделаю последнее, модель станет намного сложнее.
Любые мысли будут с благодарностью оценены.
Благодаря
Tim
. , Хорошим ресурсом для моделирования размеров является «Инструмент инвентаризации хранилищ данных» Ральфа Кимбалла. Он обсуждает компромиссы между одним измерением и дизайном снежинки. –