36

При чтении книги для бизнес-объектов я столкнулся с таблицей терминов и таблицей измерений.Разница между таблицей фактов и таблицей измерений?

Я пытаюсь понять, что отличается между таблицей измерений и таблицей фактов?

Я прочитал пару статей в Интернете, но я не был в состоянии четко понять ..

Любой простой пример поможет мне лучше понять?

+0

Концепция довольно длинная, чтобы описать ее достаточно подробно, если у вас есть конкретная проблема, выходящая за рамки базового определения, пожалуйста, сообщите нам об этом. – NoChance

+0

В основном, я пытался понять, могут ли таблицы измерений быть таблицей фактов или нет? –

ответ

27

Это ответить на часть:

Я пытался понять, можно ли таблицы измерений быть таблица фактов , как хорошо или нет?

Короткий ответ (INMO) - Нет. Это потому, что 2 типа таблиц создаются по разным причинам. Однако с точки зрения дизайна базы данных таблица измерений может иметь родительскую таблицу как случай с таблицей фактов, которая всегда имеет таблицу измерений (или больше) в качестве родителя. Кроме того, таблицы фактов могут быть агрегированы, тогда как таблицы измерений не агрегированы. Другая причина заключается в том, что таблицы фактов не должны обновляться, тогда как таблицы измерений могут быть обновлены в некоторых случаях.

Подробнее:

Факт и размерные таблицы отображаются в том, что обычно известно как Star Schema. Основная цель звездной схемы - упростить сложный нормализованный набор таблиц и консолидировать данные (возможно, из разных систем) в одну структуру базы данных, которая может быть запрошена очень эффективным способом.

В его простейшей форме он содержит таблицу фактов (пример: StoreSales) и одну или несколько таблиц измерений. Каждая запись Dimension имеет 0,1 или более связанных с ней таблиц фактов (пример таблиц измерений: география, элемент, поставщик, клиент, время и т. Д.). Было бы справедливо также, чтобы размерность имела родительский элемент, и в этом случае модель имеет тип «Снежная хлопья». Тем не менее, дизайнеры пытаются избежать такого дизайна, поскольку это приводит к увеличению числа подключений, что приводит к низкой производительности. В примере StoreSales измерение географии может состоять из столбцов (GeoID, ContenentName, CountryName, StateProvName, CityName, StartDate, EndDate)

В модели с хлопьями снега у вас может быть 2 нормализованных таблицы для геоинформации, а именно: Таблица содержания, Таблица стран.

На Схеме звезд вы найдете множество примеров. Кроме того, проверьте это, чтобы увидеть альтернативный вид модели звездной схемы Inmon vs. Kimball. У Kimbal есть хороший форум, который вы также можете посмотреть здесь: Kimball Forum.

Edit: Для того, чтобы ответить на комментарий о примерах для 4НФ:

  • Пример для таблицы фактов, нарушающего 4НФ:

Факт продаж (ID, BranchID, SalesPersonID, ItemID, сумма, TimeID)

  • Пример для таблицы фактов, не нарушая 4НФ:

AggregatedSales (BranchID, TotalAmount)

Здесь соотношение в 4НФ

Последний пример довольно редко.

+0

Хммм, нужно подумать в течение нескольких минут о хорошем ответе на этот ... – NoChance

+1

Некоторые таблицы фактов отражают данные уровня транзакции. Некоторые отражают агрегированные данные. Таблица фактов в схеме звезд не обязательно должна быть даже в 3NF. Например, Sales Fact может содержать такие данные, как (ID, BranchID, Amount, SalesPerson, Time). Это нарушает 3NF, BCNF и 4NF, потому что зависимость SalesPerson и Branch. Соответственно, неверно, что таблица типичных фактов находится в 4NF. – NoChance

+0

См. Отредактированный ответ. – NoChance

4

Я нашел этот ответ более понятным с точки зрения человека, который мало знает о терминологии DB/DW.

http://databases.about.com/od/datamining/a/Facts-Vs-Dimensions.htm

Я рекомендую идти через это первый, а затем проходит через ответ Emmad Карима для большей детализации. Надеюсь, это полезно.

+0

Первое объяснение, которое было совершенно ясно. Очень полезный пример, на простом языке, раскрывающий некоторые детали. Теперь я наконец понял. – sharon

1
  1. Таблица фактов в основном состоит из деловых фактов и внешних ключей, которые относятся к первичным ключам в таблицах размеров. Таблица измерений состоит главным образом из описательных атрибутов, которые являются текстовыми полями.
  2. Таблица измерений содержит суррогатный ключ, натуральный ключ и набор атрибутов. Напротив, таблица фактов содержит внешний ключ, измерения и вырожденные измерения.
  3. Таблицы размеров предоставляют описательную или контекстуальную информацию для измерения таблицы фактов. С другой стороны, таблицы фактов обеспечивают измерения предприятия.
  4. При сравнении размера двух таблиц таблица фактов больше, чем таблица размеров. В сравнительной таблице представлены больше измерений, чем таблицы фактов. В таблице фактов наблюдается меньшее количество фактов.
  5. Сначала необходимо загрузить таблицу размеров. При загрузке таблиц фактов нужно посмотреть таблицу измерений. Это связано с тем, что таблица фактов содержит измерения, факты и внешние ключи, которые являются первичными ключами в таблице измерений.

Подробнее: Таблица размеров и таблица фактов | Разница между | Таблица размеров и таблица фактов http://www.differencebetween.net/technology/hardware-technology/dimension-table-and-fact-table/#ixzz3SBp8kPzo

39

Это, по-видимому, очень простой ответ о том, как различать таблицы фактов и измерений!

Это может помочь придумать размеры как вещи или объекты. То, что такое как продукт может существовать без участия в бизнесе event. Измерение - это ваше существительное. Это то, что может существовать независимо от бизнес-мероприятия, такого как продажа. Продукты, сотрудники, оборудование, все, что существует. Измерение либо делает что-то, либо что-то с этим сделано.

Сотрудники продают, покупают покупатели.Работники и клиенты являются примерами размеров .

Изделия продаются, они также являются размерами, поскольку они имеют что-то , выполненное с ними.

Факты, являются глаголом. Запись в таблице фактов обозначает дискретное событие , которое происходит с чем-то из таблицы измерений. Продажа продукта будет записана в таблице фактов. Событием продажи будет , в котором указывается, какой продукт был продан, какой сотрудник его продал, и какой покупатель приобрел . Продукт, работник и клиент - все размеры , которые описывают событие, продажу.

Кроме того, таблицы фактов также обычно имеют количественные данные . Количество продано, цена за элемент, общая цена и так далее.

Источник: http://arcanecode.com/2007/07/23/dimensions-versus-facts-in-data-warehousing/

14

Star Schema состоит из Факт и измерения таблицы.

таблица фактов:

  • Он содержит все первичные ключи размерности и связанный с ними мер, как и количество продаваемого, количество продаваемого и средних продажи.

Размер таблица:

  • Таблица измерений предоставляет описательную информацию для всех измерений, записанных в таблице фактов.
  • Размеры относительно невелики, как сравнение таблицы фактов.

enter image description here

image source

+0

Это гораздо полезнее, чем принятый ответ –

1

В простейшей форме, я думаю, что таблица измерения что-то вроде «Мастер» таблицы - который держит список всех «элементов», так сказать.

Таблица фактов представляет собой таблицу транзакций, в которой описываются все транзакции. Кроме того, агрегированные (сгруппированные) данные, такие как общие продажи продавцом, общий объем продаж по отраслям - такие виды таблиц также могут существовать как независимые таблицы фактов.

Смежные вопросы