Glosario: Constante o Intersección de la recta de regresión

Cuando hacemos una regresión en nuestro programa estadístico, ¿Qué es eso que se llama intersección (o constante, en inglés: intercept)? ¿Sirve para algo? ¿Hay que informar sobre este dato en nuestros trabajos/artículos? En este artículo te voy a explicar de una forma sencilla y para que no se te vuelva a olvidar qué es la intersección en una regresión.

En una regresión lineal, la relación entre dos variables se estima en forma de una línea recta (es una relación lineal :). Y una línea recta, se define en base a su origen (intersección!) y su gradiente (o inclinación, que en regresión son las betas β).

Por lo tanto la intersección no es más que el punto de origen de la línea recta que define la relación entre dos variables. Vamos a verlo en los siguientes gráficos.

En este gráfico, ambas líneas tienen el mismo origen o intersección. En ambos casos la relación entre ambas variables parte del valor de origen 0, osea, la intersección es igual a 0. Pero la pendiente (o el gradiente, β) es diferente, por lo menos podemos decir de forma visual, que en el caso de la línea azul su β será positiva (a +x entonces +y), y en el caso de la línea roja, la relación será negativa, (a +x entonces -y).

¿Y qué pasa con la línea morada y la línea naranja?

Ambas tienen el mismo gradiente (β), pero distinta intersección. ¿Cuál es la intersección de la línea morada? ¿Y la de la línea naranja?

Pues ahí está, tan simple como eso. Ya sabes lo que es la intersección de una línea de regresión, y para siempre :o)! Si todavía te queda alguna duda, déjamela en los comentarios ;o)

y…. ¿Para qué sirve la intersección?

Bien, y cuando sabemos qué es una intersección… para qué nos sirve todo este vasto conocimiento???

Pues bueno, ejem, el valor de la intersección es muy probable que no añada ninguna información interesante a la interpretación de los datos. Normalmente, al hacer una regresión, se quiere saber si existe una relación entre dos variables y cuál es la dirección de esta relación, y no suele haber una hipótesis formulada alrededor de la intersección.

Sin embargo, es posible que la intersección de algún valor interpretable, en el caso de que la variable independiente (o predictor) pueda tomar el valor de 0. Verás más claro el significado de esta frase leyendo los dos ejemplos que aparecen a continuación.

Ejemplo 1

Se realiza un estudio en el que se observa que la relación entre la distancia que viaja una pelota de tenis (Distancia: metros) y la velocidad a la que esta pelota es golpeada por la raqueta del tenista (Velocidad: km/h) sigue la siguiente ecuación de regresión:

Distancia = 1,5 + β∙Velocidad

En esta ecuación, la intersección toma un valor de 1,5. Esto significa que, cuando la velocidad en la que la pelota es golpeada por el tenista toma un valor de 0, entonces la distancia recorrida por la pelota es igual a 1,5 metros.

Este es un ejemplo en el que la interpretación de la intersección no tiene ningún significado, puesto que no es posible que se golpee la pelota a una velocidad de 0 km/h. Este dato no estará en nuestra tabla de datos, y por lo tanto en este caso la intersección no se interpreta, se informa, pero no se interpreta.

Ejemplo 2

Se realiza un estudio para evaluar la relación entre la cantidad de monóxido de carbono que desprende un cigarro y la cantidad de nicotina que contiene. El resultado toma la forma de la siguiente ecuación de regresión:

Monóxido de Carbono = 2 + β∙Nicotina

En este ejemplo, la intersección, que es igual a 2, es la cantidad de monóxido de carbono que desprendería un cigarrillo con una cantidad igual a 0 de nicotina. Los cigarrillos sin nicotina existen (con 0 nicotina), y estos cigarrillos al quemarse producen monóxido de carbono. Por lo tanto, estaríamos aquí ante un ejemplo en el que la intersección contiene información que podría ser interesante para los resultados del estudio.

Sin embargo, he de decir, que lo más probable es que en vuestros estudios os encontréis ante situaciones similares al ejemplo 1, donde la intersección no añade ninguna información importante.

Nota: Los datos contenidos en estos dos ejemplos son totalmente ficticios.