SAS: tablas de referencias cruzadas

Las tablas de referencias cruzadas implican la creación de tablas de referencias cruzadas, también llamadas tablas condicionales, utilizando todas las combinaciones posibles de dos o más variables. En SAS, se crea utilizando FRECUENCIA DEL PROCESO Juntos con MESAS opción. Por ejemplo, si necesitamos la frecuencia de cada modelo para cada marca en cada categoría de tipos de automóviles, entonces debemos usar el parámetro TABLES para PROC FREQ.

Sintaxis

La sintaxis básica para aplicar la tabulación cruzada en SAS es:

PROC FREQ DATA = dataset;
TABLES variable_1*Variable_2;

A continuación se muestra la descripción de los parámetros utilizados:

  • Conjunto de datos este es el nombre del conjunto de datos.

  • Variable_1 y Variable_2 – los nombres de las variables del conjunto de datos, cuya distribución de frecuencia se va a calcular.

Ejemplo

Considere el caso de determinar la cantidad de tipos de automóviles disponibles para cada marca de automóviles a partir del conjunto de datos cars1 creado en el formulario SASHELP.CARS Como se muestra abajo. En este caso, necesitamos los valores de frecuencia individuales, así como la suma de los valores de frecuencia por fabricante y tipo. Podemos notar que el resultado muestra los valores por fila y columna.

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1;
tables make*type; 
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

cross_tab_1

Tabla cruzada de 3 variables

Cuando tenemos tres variables, podemos agrupar 2 de ellas y asignar cada una de esas dos a una tercera variable. Entonces, como resultado, tenemos dos tablas de referencias cruzadas.

Ejemplo

En el siguiente ejemplo, encontramos la frecuencia de cada tipo de automóvil y cada modelo de automóvil según la marca del automóvil. También utilizamos la opción nocol y norow para evitar sumas y porcentajes.

proc FREQ data = CARS2 ;
tables make * (type model)  / nocol norow nopercent;   
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

cross_tab_2

Tabla cruzada de 4 variables

Con 4 variables, el número de combinaciones pareadas aumenta a 4. Cada variable del grupo 1 se asigna a cada variable del grupo 2.

Ejemplo

En el siguiente ejemplo, encontramos la frecuencia de longitud del automóvil para cada marca y cada modelo. La frecuencia de caballos de fuerza es la misma para todas las marcas y modelos.

proc FREQ data = CARS2 ;
tables (make model) * (length  horsepower)  / nocol norow nopercent;   
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

cross_tab_3

🚫