Contenido principal
Curso: Estadística y probabilidad > Unidad 11
Lección 3: Estimar una media poblacional- Introducción al estadístico t
- Simulación que muestra el valor del estadístico t
- Condiciones para intervalos t válidos
- Referencia: condiciones para la inferencia en una media
- Condiciones para un intervalo t para una media
- Calcular el valor crítico t. Ejemplo
- Encontrar el valor crítico t* para un nivel de confianza deseado
- Construir un intervalo t para una media. Ejemplo
- Calcular un intervalo t para una media
- Intervalo de confianza para una media con datos pareados
- Hacer un intervalo t para datos pareados
- Interpretar un intervalo de confianza para una media
- El tamaño de la muestra y el margen de error en un intervalo de confianza para una media
© 2024 Khan AcademyTérminos de usoPolítica de privacidadAviso de cookies
Hacer un intervalo t para datos pareados
En algunos estudios hacemos dos observaciones en el mismo individuo. Por ejemplo, podríamos mirar las puntuaciones de cada alumno en los exámenes de preparación y en los exámenes finales de un curso. En otros estudios, podríamos querer hacer una observación en cada uno de dos individuos similares. Por ejemplo, algunas pruebas médicas implican emparejar sujetos similares para que uno reciba el medicamento y el otro reciba un placebo.
En ambos tipos de estudios, estamos trabajando con datos emparejados, y siempre que estamos trabajando con datos emparejados, normalmente estamos interesados en la diferencia entre cada pareja, por ejemplo, la diferencia entre los datos en los exámenes de preparación y de final de curso, o la diferencia entre los datos del medicamento y los datos del placebo.
Si se cumplen ciertas condiciones, podemos construir un intervalo para estimar la media de estas diferencias y extraer conclusiones.
En este artículo, vamos a revisar dos ejemplos de cómo construir un intervalo para datos emparejados. Tendrás la oportunidad de intentar resolver el segundo ejemplo por tu cuenta para asegurarte de haber entendido las ideas principales.
Ejemplo 1
Una revista quería evaluar dos relojes, el reloj A y el reloj B, que usan sistema de posicionamiento global (GPS) para calcular la distancia que alguien corre. Se dieron cuenta de que los relojes generalmente no coincidían en la distancia que alguien recorría en una carrera determinada.
La revista tomó una muestra aleatoria de suscriptores y les pidió correr kilómetros con ambos relojes a la vez (todos ellos acordaron participar). Al final de sus recorridos, los participantes registraron la distancia que recorrieron según cada reloj. Aquí están los datos (todas las distancias en kilómetros):
Corredor | |||||
---|---|---|---|---|---|
Reloj A | |||||
Reloj B |
Construye un intervalo de confianza del para estimar la diferencia de las medias en las distancias de estos relojes. ¿El intervalo sugiere que existe una diferencia entre los dos relojes?
Paso 1: Calcular las diferencias
Aunque parece que tenemos dos conjuntos de datos (reloj A y reloj B), estos datos no provienen de dos muestras independientes. La revista tomó una sola muestra de corredores, y cada corredor llevaba dos relojes, por lo que se trata de un diseño de pares igualados. Un conjunto de datos que nos interesa es la diferencia entre el reloj A y el reloj B para cada corredor. Vamos a definir esta variable como y calcular la diferencia para cada corredor:
Corredor | |||||
---|---|---|---|---|---|
Reloj A | |||||
Reloj B | |||||
Diferencia |
Idea clave: cuando se trata de datos emparejados, estamos más interesados en la distribución de las diferencias.
Paso 2: verificar las condiciones
Queremos usar estas diferencias para construir un intervalo de confianza para la diferencia de las medias. Puesto que no conocemos la desviación estándar de la población de las diferencias, tendremos que utilizar la desviación estándar de la muestra en su lugar. Esto hace que sea necesario utilizar un intervalo en lugar de un intervalo para estimar la diferencia de las medias. Vamos a ver las condiciones para construir un intervalo .
- Aleatoriedad: la revista tomó una muestra aleatoria de sus suscriptores.
- Normalidad: ya que nuestra muestra de
corredores es pequeña, tenemos que graficar los datos. Las diferencias son aproximadamente simétricas y sin valores atípicos, por lo que debe ser seguro proceder.
- Independencia: es razonable suponer la independencia entre las mediciones de cada corredor. Se seleccionaron al azar, y no deberían influir en los resultados de cada uno.
Paso 3: construir el intervalo
Aquí están los datos:
Corredor | |||||
---|---|---|---|---|---|
Reloj A | |||||
Reloj B | |||||
Diferencia |
Aquí está el resumen estadístico:
Media | desviación estándar | |
---|---|---|
Reloj A | ||
Reloj B | ||
Diferencia |
Como queremos construir un intervalo de confianza para la diferencia de las medias, solamente necesitamos el resumen estadístico de las diferencias.
Utilizaremos la fórmula para un intervalo de una muestra para una media:
Componentes de la fórmula:
Nuestro estadístico es la media muestral .
Nuestro tamaño de la muestra es corredores.
Nuestra desviación estándar es .
Nuestros grados de libertad son , así que para una confianza de , nuestro valor crítico es .
Cálculos:
Intervalo
Paso 4: interpretar el intervalo
¿El intervalo sugiere que existe una diferencia entre los dos relojes?
Estamos seguros de que el intervalo capta la diferencia de medias entre las distancias (en kilómetros) registrada por los relojes en este tipo de carrera. Observa que el intervalo contiene , que representa que no hay diferencia, por lo que es creíble que no existan diferencias entre las distancias medidas por el reloj A y el reloj B.
Si el intervalo completo hubiera estado encima de (todos valores positivos), o si hubiera estado enteramente por debajo de (todos valores negativos), se habría sugerido una diferencia entre los dos relojes.
Ejemplo 2—¡Inténtalo!
Una página web educativa ofrece un programa de práctica para el examen de admisión de la escuela de leyes (LSAT). Los usuarios del programa toman un examen de práctica y un examen final. Aquí están los resultados y ganancias para una muestra aleatoria de usuarios:
Usuario | ||||||
---|---|---|---|---|---|---|
Práctica | ||||||
Final | ||||||
Mejora |
Aquí está el resumen estadístico:
Media | Desviación estándar | |
---|---|---|
Práctica | ||
Final | ||
Mejora |
Los creadores de la página web dicen que este intervalo proporciona pruebas sólidas de que mediante su programa causan un aumento en la puntuación del LSAT de un usuario.
¿Quieres unirte a la conversación?
Sin publicaciones aún.