Almacén de datos: esquemas

Un esquema se define como una descripción lógica de una base de datos en la que se combinan lógicamente tablas de hechos y dimensiones. El almacén de datos es compatible con los esquemas Star, Snowflake y Fact Constellation.

Esquema de estrella

El esquema en estrella contiene una tabla de hechos y varias tablas de dimensiones. Cada dimensión está representada solo por una tabla unidimensional y no están normalizadas. Una tabla de dimensiones contiene un conjunto de atributos.

Caracteristicas

  • Un esquema en estrella tiene solo una tabla de hechos y varias tablas de dimensiones.
  • En el diagrama de estrella, cada dimensión está representada por una tabla unidimensional.
  • Las tablas de dimensiones no están normalizadas en el esquema de estrella.
  • Cada tabla de dimensiones está conectada a una clave en la tabla de hechos.

La siguiente figura muestra los datos de ventas de una empresa en cuatro dimensiones, a saber, tiempo, puesto, sucursal y ubicación.

Esquema de estrella

Hay una tabla de hechos en el centro. Contiene pistas sobre cada una de las cuatro dimensiones. La tabla de hechos también contiene atributos, a saber, dólares vendidos y unidades vendidas.

Nota – Cada dimensión tiene solo una tabla unidimensional y cada tabla contiene un conjunto de atributos. Por ejemplo, una tabla de dimensiones de ubicación contiene el conjunto de atributos {location_key, street, city, Province_or_state, country}. Esta limitación puede provocar redundancia de datos.

por ejemplo – Ambas ciudades, Vancouver y Victoria, están ubicadas en la provincia canadiense de Columbia Británica. Los registros de dichas ciudades pueden causar redundancia en los atributos Province_or_state y country.

Esquema de copo de nieve

Algunas tablas de dimensiones del esquema Snowflake están normalizadas. La normalización divide los datos en tablas adicionales, como se muestra en la siguiente figura.

Esquema de copo de nieve

A diferencia del esquema de estrella, la tabla de dimensiones en el esquema de copo de nieve está normalizada.

por ejemplo – La tabla de dimensiones de elementos en un esquema en estrella se normaliza y se divide en dos tablas de dimensiones, a saber, la tabla de elementos y de proveedores. La tabla de dimensiones del artículo ahora contiene los atributos item_key, item_name, type, brand y provider-key.

La clave del proveedor está asociada con la tabla de dimensiones del proveedor. La tabla de dimensiones del proveedor contiene los atributos clave_proveedor y tipo_proveedor.

Nota – Debido a la normalización en el esquema Snowflake, la redundancia se reduce y, por lo tanto, se vuelve más fácil de mantener y ahorrar espacio de almacenamiento.

Diagrama de constelación de hechos (diagrama de galaxias)

La constelación de hechos tiene múltiples tablas de hechos. Esto también se conoce como el contorno de la galaxia.

La siguiente figura muestra dos tablas de hechos, Ventas y Envío.

Esquema de galaxia

La tabla de hechos de ventas es la misma que en el esquema en estrella. La tabla de hechos del remitente tiene cinco dimensiones, a saber, item_key, time_key, shipper_key, from_location, to_location. La tabla de datos de envío también contiene dos medidas, a saber, dólares vendidos y unidades vendidas. También se pueden compartir tablas de hechos.

por ejemplo – Las tablas de dimensiones de tiempo, artículo y ubicación se utilizan junto con las tablas de hechos de ventas y envío.

🚫