En este post se explica qué es el análisis de regresión y para qué sirve en estadística. Además, podrás ver cuáles son los diferentes tipos de análisis de regresión.
Índice
¿Qué es el análisis de regresión?
En estadística, el análisis de regresión es un proceso en el que se estudia la relación entre dos o más variables. En concreto, el análisis de regresión consiste en calcular una ecuación que relacione las variables de estudio de manera matemática.
El modelo construido en un análisis de regresión se llama modelo de regresión, mientras que la ecuación que relaciona las variables de estudio se dice ecuación de regresión.
Por ejemplo, si se quiere estudiar la relación entre la inflación de un país con su PIB, se puede llevar a cabo un análisis de regresión para analizar la relación entre las dos variables. En este caso, la ecuación obtenida del análisis de regresión sería una recta de regresión.
Así pues, una análisis de regresión consiste en recopilar una muestra de datos y, a partir de los datos recopilados, se calcula una ecuación que permite relacionar matemáticamente las variables de estudio.
En los análisis de regresión, es importante distinguir los dos tipos de variables que se pueden incluir en el modelo de regresión:
- Variable dependiente (o variable respuesta): es el factor que queremos analizar, de modo que se construirá un modelo de regresión para ver cómo varia el valor de esta variable en función del valor de otras variables.
- Variable independiente (o variable explicativa): es un factor que consideramos que puede influir en la variable que queremos analizar. Es decir, el valor de la variable independiente afecta al valor de la variable dependiente.
Tipos de análisis de regresión
Básicamente, existen tres tipos de análisis de regresión:
- Análisis de regresión lineal simple: el modelo de regresión tiene una variable independiente y una variable dependiente y se relacionan de manera lineal.
- Análisis de regresión lineal múltiple: se relacionan linealmente dos o más variables independientes con una variable dependiente.
- Análisis de regresión no lineal: se modeliza la relación entre la variable independiente y la variable dependiente mediante una función no lineal.
Análisis de regresión lineal simple
La regresión lineal simple se usa para relacionar una variable independiente X con una variable dependiente Y. Es decir, en una regresión lineal simple solo hay dos variables (la variable explicativa X y la variable respuesta Y) y se intenta aproximar la relación que hay entre ambas variables mediante una ecuación lineal.
La ecuación de un modelo de regresión lineal simple es una recta, por lo que está formada por dos coeficientes: la constante de la ecuación (β0) y el coeficiente de la correlación entre las dos variables (β1). Por lo tanto, la ecuación de un modelo de regresión lineal simple es y=β0+β1x.
Las fórmulas para calcular los coeficientes de la regresión lineal simple son las siguientes:
Donde:
- es la constante de la recta de regresión.
- es la pendiente de la recta de regresión.
- es el valor de la variable independiente X del dato i.
- es el valor de la variable dependiente Y del dato i.
- es la media de los valores de la variable independiente X.
- es la media de los valores de la variable dependiente Y.
Análisis de regresión lineal múltiple
En un modelo de regresión lineal múltiple se incluyen dos o más variables independientes. Es decir, la regresión lineal múltiple permite relacionar varias variables explicativas con una variable respuesta de manera lineal. Por lo tanto, la ecuación de un modelo de regresión lineal múltiple es la siguiente:
Donde:
- es la variable dependiente.
- es la variable independiente i.
- es la constante de la ecuación de la regresión lineal múltiple.
- es el coeficiente de regresión asociado a la variable .
- es el error o residuo, es decir, la diferencia entre el valor observado y el valor estimado por el modelo.
- es el número total de variables del modelo.
De modo que si tenemos una muestra con un total de observaciones, podemos plantear el modelo de regresión lineal múltiple en forma matricial:
La expresión matricial anterior se puede reescribir asignando una letra a cada matriz:
Así pues, aplicando el criterio de los mínimos cuadrados, se puede llegar a la fórmula para estimar los coeficientes de un modelo de regresión lineal múltiple:
No obstante, aplicar esta fórmula es muy laborioso y lleva mucho tiempo, por lo que en la práctica se recomienda usar un software informático (como Minitab o Excel) que permite realizar un modelo de regresión múltiple de manera mucho más rápida.
Análisis de regresión no lineal
En estadística, la regresión no lineal es un tipo de regresión en el que se utiliza una función no lineal como modelo de la ecuación de regresión. Por lo tanto, la ecuación de un modelo de regresión no lineal es una función no lineal.
Lógicamente, la regresión no lineal se utiliza para relacionar la variable independiente con la variable dependiente cuando la relación entre ambas variables no es lineal. Así pues, si al representar gráficamente la muestra de datos, observamos que no tienen una relación lineal, es decir, que no forman aproximadamente una línea recta, es mejor utilizar un modelo de regresión no lineal.
Por ejemplo, la ecuación y=3-5x-8x2+x3 es un modelo de regresión no lineal, ya que relaciona matemáticamente la variable independiente X con la variable dependiente Y mediante una función cúbica.
Principalmente, se distinguen tres tipos de regresión no lineal:
- Regresión polinomial: regresión no lineal cuya ecuación tiene forma de polinomio.
- Regresión logarítmica: regresión no lineal en la que se hace el logaritmo de la variable independiente.
- Regresión exponencial: regresión no lineal en la cual la variable independiente se encuentra en el exponente de la ecuación.
¿Para qué sirve el análisis de regresión?
El análisis de regresión tiene dos usos básicamente: el análisis de regresión sirve para explicar la relación entre las variables explicativas y la variable respuesta y, asimismo, el análisis de regresión se utiliza para predecir el valor de la variable dependiente para una nueva observación.
Al obtener la ecuación del modelo de regresión, podemos saber qué tipo de relación hay entre las variables del modelo. Si el coeficiente de regresión de una variable independiente es positivo, la variable dependiente aumentará cuando esta aumente. Mientras que si el coeficiente de regresión de una variable independiente es negativo, la variable dependiente disminuirá cuando esta aumente.
Por otro lado, la ecuación matemática obtenida del análisis de regresión también nos permite hacer predicciones de valores. Así pues, introduciendo los valores de las variables explicativas en la ecuación del modelo de regresión, podremos calcular el valor de la variable dependiente para un dato nuevo.
Breve explicacion pero muy clara.
¡Gracias Rodrigo!
Buena explicación. Gracias