Es innegable que hay conceptos en este mundo de la ciencia que son universalmente conocidos pero nunca lo suficientemente reconocidos. Dentro de este conjunto se incluye, sin duda alguna, la regresión lineal. En este post no pretendemos hacer una disertación sobre su empleo, sobre las características que debe tener el resultado para aceptarlo ni rechazarlo y menos aún tratar conceptos tan complicados como difíciles, a veces, hasta de escribir (véase heterocedasticidad o colinealidad). Para ello recomendamos la interminable bibliografía que se puede encontrar sobre el tema en la web o cualquier librería técnica que se precie. En esta entrada simplemente vamos a rendirle un sencillo homenaje a todo lo que su descubrimiento y aplicación ha supuesto al mundo científico en los dos últimos siglos.

¿Que es una regresión lineal?

El genetista Francis Galton descubrió un fenómeno que consistía en que la estatura de los hijos solía ser una regresión a la estatura media poblacional en comparación a la estatura de sus padres, es decir, padres altos solían tener hijos algo más bajos y viceversa. A este fenómeno lo denominó “acertadamente” regresión a la mediocridad y se da por hecho que este es el origen etimológico del nombre. En 1805, Legendre, desarrolla el método matemático que mayoritariamente subyace bajo el nombre de regresión lineal, el método de mínimos cuadrados, a partir de la aplicación del Teorema de Gauss-Márkov.

La regresión lineal es una herramienta que permite ver la relación entre distintas variables correlacionadas. Mediante ella se puede investigar la analogía entre una variable dependiente y otra independiente (regresión lineal simple) o entre varias independientes (regresión lineal múltiple) con fines, mayoritariamente predictivos. La regresión lineal conlleva, además, una serie de procedimientos de diagnóstico que confirman la viabilidad de la predicción.

Existen diferentes métodos para ajustar una recta a la nube de puntos consecuencia de la representación de las variables. Tradicionalmente, se usa la que minimiza la suma de las distancias verticales entre los puntos y la recta comúnmente conocida por “mínimos cuadrados”. Esto significa que de todas las posibles rectas, existirá una, y solo una, que cumpla esta premisa y que, por tanto, sus estimadores tendrán la menor varianza de entre todos los estimadores lineales e insesgados tal y como indica el Teorema de Gauss-Márkov.

¿Por qué es tan apreciada la regresión?

Sencillamente por que es fácil de entender para alguien que no tiene el más mínimo conocimiento de estadística. El poder predecir el valor de algo desconocido apoyándonos en los valores que conocemos, es sin duda una de las mayores inquietudes que puede tener el ser humano, por ello no es arriesgado decir que todos los que nos dedicamos en mayor o menor medida al análisis de datos (sin incluir a los “estadísticos de carrera”) hemos comenzado nuestra formación en este mundo con el descubrimiento del concepto de regresión y con las utilidades que nos brinda, especialmente desde el punto de vista predictivo.

La regresión lineal como tal es un concepto sencillo para alguien que tenga un mínimo conocimiento matemático, no siendo necesario un grado universitario para su construcción y manejo. Eso sí, una acertada validación va más allá, y aquí es donde debe entrar alguien con una adecuada formación, si bien no profunda, al menos parcial sobre ciertos conceptos estadísticos de forma que no se caían en predicciones erróneas y conclusiones equivocadas.

Por otro lado, al enfrentarnos a un análisis estadístico, muchas veces pensamos en las posibles soluciones y desechamos la aplicación de la regresión lineal precisamente por su sencillez, olvidándonos de un aspecto en el que deberíamos basar todos nuestros análisis: “a veces lo más sencillo es lo más efectivo”  o, acaso, ¿No es esta una de las formas de evitar problemas de colinealidad? ups, perdón, ya lo he usado, …

 

 

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies