Contenido principal
Estadística y probabilidad
Curso: Estadística y probabilidad > Unidad 5
Lección 5: Evaluar el ajuste en la regresión por mínimos cuadrados- Gráficas de residuos
- Gráficas de residuos
- Ideas intuitivas detrás de la R cuadrada
- R cuadrada o coeficiente de determinación
- Desviación estándar de los residuos o raíz del error cuadrático medio (ECM)
- Interpretar datos de regresión por computadora
- Interpretar los resultados de una regresión obtenidos por computadora
- El impacto de eliminar valores atípicos en las rectas de regresión
- Efectos de los puntos influyentes
© 2023 Khan AcademyTérminos de usoPolítica de privacidadAviso de cookies
Ideas intuitivas detrás de la R cuadrada
Cuando aprendimos sobre el coeficiente de correlación, , nos centramos en lo que significaba en lugar de cómo calcularlo, ya que los cálculos son largos y generalmente las computadoras los resuelven por nosotros.
Vamos a hacer lo mismo con y concentrarnos en cómo interpretar lo que significa.
En cierto modo, mide qué tanto se elimina del error de predicción al usar la regresión por mínimos cuadrados.
Predicciones sin usar regresión
Usamos la regresión lineal para predecir dado un valor de . Pero supongamos que tenemos que predecir un valor de sin un valor correspondiente de .
Sin utilizar la regresión en la variable , nuestra estimación más razonable sería simplemente predecir el promedio de los valores de .
Este es un ejemplo donde la recta de predicción es simplemente la media de los datos de :
Observa que esta recta no parece ajustarse muy bien a los datos. Una forma de medir el ajuste de la recta es calcular la suma de los residuos al cuadrado, esto nos da un sentido general de cuánto error de predicción tiene un modelo dado.
Así que sin la regresión por mínimos cuadrados, la suma de los cuadrados es
¿Usar la regresión por mínimos cuadrados reduciría el error en la predicción? Si es así, ¿por cuánto? ¡Veámoslo!
Predicciones con el uso de la regresión
Aquí te presentamos los mismos datos con la recta de regresión por mínimos cuadrados correspondiente y el resumen estadístico:
Ecuación | ||
---|---|---|
Esta recta parece ajustar los datos bastante bien, pero para medir qué tanto mejor se ajusta, podemos fijarnos otra vez en la suma de los cuadrados de los residuos:
Al usar la regresión por mínimos cuadrados se redujo la suma de los cuadrados de los residuos de a .
Así que con la regresión por mínimos cuadrados eliminamos una cantidad considerable del error de predicción. Pero, ¿qué tanto?
La R cuadrada mide qué tanto error de predicción eliminamos
Sin usar la regresión, el modelo tenía una suma total de cuadrados de . Mediante la regresión por mínimos cuadrados se redujo a .
Por lo que la reducción total es de .
Podemos representar esta reducción como un porcentaje de la cantidad original del error de predicción:
Si te fijas más arriba, verás que .
R-cuadrada nos dice qué porcentaje del error de predicción en la variable se elimina al usar la regresión por mínimos cuadrados en la variable .
Como resultado, a también se le llama coeficiente de determinación.
En muchas definiciones formales, nos dice qué porcentaje de variabilidad en la variable está contabilizada por la regresión en la variable .
Parece bastante notable que simplemente elevar al cuadrado nos dé esa medida. Demostrar esta relación entre y es bastante complejo y está fuera del alcance de un curso introductorio de estadística.
¿Quieres unirte a la conversación?
- Está del cocol que pongan lecciones y no sea obligatorio que el maestro las deje con secuencia. Yo ni había visto nada de regresión lineal y tuve que pagar porque me ayudaran para exlicármelo porque no entendí nada de lo que aquí ponen como sacar la ecuación de recta ni r ni r2(3 votos)