SAS – Asignación de frecuencia

La distribución de frecuencia es una tabla que muestra la frecuencia de puntos de datos en un conjunto de datos. Cada entrada de la tabla contiene la frecuencia o el número de ocurrencias de valores en un grupo o intervalo particular y, por lo tanto, la tabla resume la distribución de valores en la muestra.

SAS proporciona un procedimiento llamado FRECUENCIA DEL PROCESO para calcular la distribución de frecuencia de puntos de datos en un conjunto de datos.

Sintaxis

La sintaxis básica para calcular la distribución de frecuencia en SAS es:

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

A continuación se muestra la descripción de los parámetros utilizados:

  • Conjunto de datos este es el nombre del conjunto de datos.

  • Variables_1 son los nombres de las variables en el conjunto de datos cuya distribución de frecuencia se va a calcular.

  • Variables_2 – variables que clasifican el resultado de la distribución de frecuencias.

Distribución de una frecuencia variable

Podemos determinar la distribución de frecuencia de una variable usando FRECUENCIA DEL PROCESO. En este caso, el resultado mostrará la frecuencia de cada valor de la variable. El resultado también muestra la distribución porcentual, la frecuencia acumulada y el porcentaje acumulativo.

Ejemplo

En el siguiente ejemplo, encontramos la distribución de frecuencia de potencia variable para un conjunto de datos llamado COCHES1 que se genera a partir de la biblioteca Coches SASHELP. Podemos ver el resultado dividido en dos categorías de resultados. Uno para cada marca de automóvil.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

FREQ_By2

Distribución de múltiples frecuencias variables

Podemos encontrar distribuciones de frecuencia para varias variables que las agrupan en todas las combinaciones posibles.

Ejemplo

En el siguiente ejemplo, calculamos la distribución de frecuencia de la marca del automóvil para agrupados por tipo de vehículo así como la distribución de frecuencias de cada tipo de coche agrupados por marca.

proc FREQ data = CARS1 ;
tables make type; 
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

FREQ_tables1

Distribución de frecuencia teniendo en cuenta el peso

Con la opción de ponderación, podemos calcular la distribución de frecuencia dada la ponderación de la variable. Aquí, el valor de la variable se toma como el número de observaciones, no como el número de valores.

Ejemplo

En el siguiente ejemplo, calculamos la distribución de frecuencia de los fabricantes y los tipos de variables con pesos asignados a los caballos de fuerza.

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

FREQ_tables3

🚫