SAS – Regresión lineal

La regresión lineal se utiliza para determinar la relación entre una variable dependiente y una o más variables independientes. Se propone un modelo de relación y se utilizan estimaciones de valores de parámetros para construir una ecuación de regresión estimada.

Luego se utilizan varias pruebas para determinar si el modelo es satisfactorio. Si es así, la ecuación de regresión calculada se puede utilizar para predecir el valor de la variable dependiente, teniendo en cuenta los valores de las variables independientes. El procedimiento SAS PROC REG se utiliza para encontrar un modelo de regresión lineal entre dos variables.

Sintaxis

La sintaxis básica para aplicar PROC REG en SAS es:

PROC REG DATA = dataset;
MODEL variable_1 = variable_2;

A continuación se muestra la descripción de los parámetros utilizados:

  • Conjunto de datos este es el nombre del conjunto de datos.

  • variable_1 y variable_2 – los nombres de las variables del conjunto de datos utilizados para encontrar la correlación.

Ejemplo

El siguiente ejemplo muestra el proceso de encontrar la correlación entre dos caballos de fuerza variables y la masa del vehículo usando PROC REG. Como resultado, vemos los valores del punto de intersección, que se pueden usar para formar la ecuación de regresión.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

regression_1

El código anterior también proporciona una representación gráfica de las distintas puntuaciones del modelo, como se muestra a continuación. Como procedimiento SAS avanzado, simplemente no se limita a emitir valores de intercepción como salida.

regresión_2

🚫