SAS – Análisis de correlación

El análisis de correlación se ocupa de las relaciones entre variables. El coeficiente de correlación es una medida de la relación lineal entre dos variables. Los valores del coeficiente de correlación están siempre en el rango de -1 a +1. SAS proporciona un procedimiento PROC CORR para encontrar los coeficientes de correlación entre un par de variables en el conjunto de datos.

Sintaxis

La sintaxis básica para aplicar PROC CORR en SAS es:

PROC CORR DATA = dataset options;
VAR variable;

A continuación se muestra la descripción de los parámetros utilizados:

  • Conjunto de datos este es el nombre del conjunto de datos.

  • Opciones esta es una opción adicional con un procedimiento como construir una matriz, etc.

  • Variable – el nombre de la variable del conjunto de datos utilizado al encontrar la correlación.

Ejemplo

Los coeficientes de correlación entre un par de variables disponibles en el conjunto de datos se pueden obtener usando sus nombres en el operador VAR. En el siguiente ejemplo, usamos el conjunto de datos CARS1 y obtenemos un resultado que muestra los coeficientes de correlación entre potencia y peso.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

corr_ana_2

Correlación entre todas las variables

Los coeficientes de correlación entre todas las variables disponibles en el conjunto de datos se pueden obtener simplemente aplicando el procedimiento con el nombre del conjunto de datos.

Ejemplo

En el siguiente ejemplo, usamos el conjunto de datos CARS1 y obtenemos un resultado que muestra los coeficientes de correlación entre cada par de variables.

proc corr data = cars1 ;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

corr_ana_1

Matriz de correlación

Podemos obtener la matriz de la gráfica de dispersión entre variables eligiendo la opción de graficar la matriz en PROCEDIMIENTO declaración.

Ejemplo

En el siguiente ejemplo, obtenemos la matriz entre potencia y peso.

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

corr_ana_3

🚫