OBIEE – Modelado dimensional

El modelado dimensional proporciona un conjunto de técnicas y conceptos que se utilizan en el diseño DW. Según el consultor de DW Ralph Kimball, el modelado dimensional es una técnica de diseño de bases de datos diseñada para respaldar las consultas del usuario final en un almacén de datos. Se centra en la claridad y el rendimiento. Si bien la ER orientada a transacciones es muy útil para capturar transacciones, dijo, debe evitarse para la entrega a los usuarios finales.

El modelado dimensional siempre usa hechos y tablas de dimensiones. Los hechos son valores numéricos que se pueden agregar y analizar en función de los valores de los hechos. Las dimensiones definen la jerarquía y la descripción de los valores de hechos.

tabla de tallas

Una tabla de dimensiones almacena atributos que describen objetos en una tabla de hechos. Una tabla de dimensiones tiene una clave principal que identifica de forma única cada fila de la dimensión. Esta clave se utiliza para vincular la tabla de dimensiones a la tabla de hechos.

Las tablas de dimensiones generalmente no están normalizadas porque no se crean para ejecutar transacciones, sino que solo se utilizan para el análisis detallado de los datos.

Ejemplo

En la siguiente tabla de dimensiones, la dimensión del cliente generalmente incluye el nombre de los clientes, la dirección, la identificación del cliente, el sexo, el grupo de ingresos, el nivel de educación, etc.

ID de usuario Nombre Suelo Ingreso Educación Religión
uno Brian Edge METRO 2 3 cuatro
2 Fred Smith METRO 3 cinco uno
3 Sally Jones F uno 7 3

Tablas de hechos

Una tabla de hechos contiene valores numéricos conocidos como dimensiones. Una tabla de hechos tiene dos tipos de columnas: hechos y una clave externa para las tablas de dimensiones.

Hay tres tipos de medidas en la tabla de hechos:

  • Aditivo – Medidas que se pueden agregar en cualquier dimensión.

  • Sin aditivos – Medidas que no se pueden agregar a lo largo de ninguna dimensión.

  • Semi-aditivo – Medidas que se pueden agregar para algunos parámetros.

Ejemplo

ID de tiempo número de identificación del producto ID de usuario Unidad vendida
cuatro 17 2 uno
8 21 años 3 2
8 cuatro uno uno

Estas tablas de hechos contienen claves externas para la dimensión del tiempo, la dimensión del producto, la dimensión del cliente y la unidad de valor vendido.

Suponga que una empresa vende productos a sus clientes. Cada venta es un hecho que ocurre dentro de la empresa y se utiliza una tabla de hechos para registrar estos hechos.

Hechos generales: Unidades vendidas, Margen, Ingresos por ventas, etc. La tabla de dimensiones enumera factores como cliente, tiempo, producto, etc., mediante los cuales queremos analizar los datos.

Ahora, si miramos la tabla de hechos anterior y la dimensión Cliente, entonces las dimensiones Producto y Tiempo también están ahí. Dada esta tabla de hechos y estas tablas de tres dimensiones, podemos hacer preguntas como: ¿Cuántos relojes se vendieron a clientes masculinos en 2010?

Diferencia entre tamaño y tabla de hechos

La diferencia funcional entre las tablas de dimensiones y las tablas de hechos es que las tablas de hechos contienen los datos que queremos analizar y las tablas de dimensiones contienen la información que necesitamos para consultarlos.

Tabla dinámica

Una tabla agregada contiene datos agregados que se pueden calcular utilizando varias funciones agregadas.

Un función agregada es una función en la que los valores de varias filas se agrupan como entrada de acuerdo con ciertos criterios para formar un valor de un valor o dimensión más significativo.

Las funciones agregadas comunes incluyen:

  • Medio()
  • Pensar()
  • Máximo ()
  • Mediana ()
  • Mínimo ()
  • Modo()
  • Suma ()

Estas tablas agregadas se utilizan para optimizar el rendimiento al ejecutar consultas complejas en el almacén de datos.

Ejemplo

Está guardando tablas con datos agregados como anual (1 fila), trimestral (4 filas), mensual (12 filas) y ahora necesita hacer una comparación de datos, por ejemplo, solo se procesará 1 fila anualmente. Sin embargo, en una tabla no agregada, se procesarán todas las filas.

MIN Devuelve el valor más pequeño de la columna especificada.
MÁXIMO Devuelve el valor más grande en la columna especificada.
SUMA Devuelve la suma de los valores numéricos de la columna especificada.
AVG Devuelve el promedio de la columna dada.
PENSAR Devuelve el número total de valores en la columna especificada.
PENSAR

Devuelve el número de filas de una tabla.

Seleccione Promedio (salario) para el empleado, donde título = ‘desarrollador’. Este informe devolverá el salario promedio de todos los empleados cuyo título sea Desarrollador.

Las agregaciones se pueden aplicar a nivel de base de datos. Puede crear agregados y almacenarlos en tablas de agregados en la base de datos, o aplicar agregados sobre la marcha a nivel de informe. Nota

– Si almacena agregados a nivel de base de datos, ahorra tiempo y proporciona optimizaciones de rendimiento.

🚫