La distribución de frecuencia es una tabla que muestra la frecuencia de puntos de datos en un conjunto de datos. Cada entrada de la tabla contiene la frecuencia o el número de ocurrencias de valores en un grupo o intervalo particular y, por lo tanto, la tabla resume la distribución de valores en la muestra.
SAS proporciona un procedimiento llamado FRECUENCIA DEL PROCESO para calcular la distribución de frecuencia de puntos de datos en un conjunto de datos.
La sintaxis básica para calcular la distribución de frecuencia en SAS es:
PROC FREQ DATA = Dataset ; TABLES Variable_1 ; BY Variable_2 ;
A continuación se muestra la descripción de los parámetros utilizados:
Conjunto de datos este es el nombre del conjunto de datos.
Variables_1 son los nombres de las variables en el conjunto de datos cuya distribución de frecuencia se va a calcular.
Variables_2 – variables que clasifican el resultado de la distribución de frecuencias.
Podemos determinar la distribución de frecuencia de una variable usando FRECUENCIA DEL PROCESO. En este caso, el resultado mostrará la frecuencia de cada valor de la variable. El resultado también muestra la distribución porcentual, la frecuencia acumulada y el porcentaje acumulativo.
En el siguiente ejemplo, encontramos la distribución de frecuencia de potencia variable para un conjunto de datos llamado COCHES1 que se genera a partir de la biblioteca Coches SASHELP. Podemos ver el resultado dividido en dos categorÃas de resultados. Uno para cada marca de automóvil.
PROC SQL; create table CARS1 as SELECT make, model, type, invoice, horsepower, length, weight FROM SASHELP.CARS WHERE make in ('Audi','BMW') ; RUN; proc FREQ data = CARS1 ; tables horsepower; by make; run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:
Podemos encontrar distribuciones de frecuencia para varias variables que las agrupan en todas las combinaciones posibles.
En el siguiente ejemplo, calculamos la distribución de frecuencia de la marca del automóvil para agrupados por tipo de vehÃculo asà como la distribución de frecuencias de cada tipo de coche agrupados por marca.
proc FREQ data = CARS1 ; tables make type; run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:
Con la opción de ponderación, podemos calcular la distribución de frecuencia dada la ponderación de la variable. AquÃ, el valor de la variable se toma como el número de observaciones, no como el número de valores.
En el siguiente ejemplo, calculamos la distribución de frecuencia de los fabricantes y los tipos de variables con pesos asignados a los caballos de fuerza.
proc FREQ data = CARS1 ; tables make type; weight horsepower; run;
Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:
🚫