Las tablas de referencias cruzadas implican la creación de tablas de referencias cruzadas, también llamadas tablas condicionales, utilizando todas las combinaciones posibles de dos o más variables. En SAS, se crea utilizando FRECUENCIA DEL PROCESO Juntos con MESAS opción. Por ejemplo, si necesitamos la frecuencia de cada modelo para cada marca en cada categorÃa de tipos de automóviles, entonces debemos usar el parámetro TABLES para PROC FREQ.
La sintaxis básica para aplicar la tabulación cruzada en SAS es:
PROC FREQ DATA = dataset; TABLES variable_1*Variable_2;
A continuación se muestra la descripción de los parámetros utilizados:
Conjunto de datos este es el nombre del conjunto de datos.
Variable_1 y Variable_2 – los nombres de las variables del conjunto de datos, cuya distribución de frecuencia se va a calcular.
Considere el caso de determinar la cantidad de tipos de automóviles disponibles para cada marca de automóviles a partir del conjunto de datos cars1 creado en el formulario SASHELP.CARS Como se muestra abajo. En este caso, necesitamos los valores de frecuencia individuales, asà como la suma de los valores de frecuencia por fabricante y tipo. Podemos notar que el resultado muestra los valores por fila y columna.
PROC SQL; create table CARS1 as SELECT make, type, invoice, horsepower, length, weight FROM SASHELP.CARS WHERE make in ('Audi','BMW') ; RUN; proc FREQ data = CARS1; tables make*type; run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:
Cuando tenemos tres variables, podemos agrupar 2 de ellas y asignar cada una de esas dos a una tercera variable. Entonces, como resultado, tenemos dos tablas de referencias cruzadas.
En el siguiente ejemplo, encontramos la frecuencia de cada tipo de automóvil y cada modelo de automóvil según la marca del automóvil. También utilizamos la opción nocol y norow para evitar sumas y porcentajes.
proc FREQ data = CARS2 ; tables make * (type model) / nocol norow nopercent; run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:
Con 4 variables, el número de combinaciones pareadas aumenta a 4. Cada variable del grupo 1 se asigna a cada variable del grupo 2.
En el siguiente ejemplo, encontramos la frecuencia de longitud del automóvil para cada marca y cada modelo. La frecuencia de caballos de fuerza es la misma para todas las marcas y modelos.
proc FREQ data = CARS2 ; tables (make model) * (length horsepower) / nocol norow nopercent; run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:
🚫