If you're seeing this message, it means we're having trouble loading external resources on our website.

Si estás detrás de un filtro de páginas web, por favor asegúrate de que los dominios *.kastatic.org y *.kasandbox.org estén desbloqueados.

Contenido principal

Hacer un intervalo t para datos pareados

En algunos estudios hacemos dos observaciones en el mismo individuo. Por ejemplo, podríamos mirar las puntuaciones de cada alumno en los exámenes de preparación y en los exámenes finales de un curso. En otros estudios, podríamos querer hacer una observación en cada uno de dos individuos similares. Por ejemplo, algunas pruebas médicas implican emparejar sujetos similares para que uno reciba el medicamento y el otro reciba un placebo.
En ambos tipos de estudios, estamos trabajando con datos emparejados, y siempre que estamos trabajando con datos emparejados, normalmente estamos interesados en la diferencia entre cada pareja, por ejemplo, la diferencia entre los datos en los exámenes de preparación y de final de curso, o la diferencia entre los datos del medicamento y los datos del placebo.
Si se cumplen ciertas condiciones, podemos construir un intervalo t para estimar la media de estas diferencias y extraer conclusiones.
En este artículo, vamos a revisar dos ejemplos de cómo construir un intervalo t para datos emparejados. Tendrás la oportunidad de intentar resolver el segundo ejemplo por tu cuenta para asegurarte de haber entendido las ideas principales.

Ejemplo 1

Una revista quería evaluar dos relojes, el reloj A y el reloj B, que usan sistema de posicionamiento global (GPS) para calcular la distancia que alguien corre. Se dieron cuenta de que los relojes generalmente no coincidían en la distancia que alguien recorría en una carrera determinada.
La revista tomó una muestra aleatoria de 5 suscriptores y les pidió correr 10 kilómetros con ambos relojes a la vez (todos ellos acordaron participar). Al final de sus recorridos, los participantes registraron la distancia que recorrieron según cada reloj. Aquí están los datos (todas las distancias en kilómetros):
Corredor12345
Reloj A9.89.810.110.110.2
Reloj B10.11010.29.910.1
Construye un intervalo de confianza del 95% para estimar la diferencia de las medias en las distancias de estos relojes. ¿El intervalo sugiere que existe una diferencia entre los dos relojes?

Paso 1: Calcular las diferencias

Aunque parece que tenemos dos conjuntos de datos (reloj A y reloj B), estos datos no provienen de dos muestras independientes. La revista tomó una sola muestra de 5 corredores, y cada corredor llevaba dos relojes, por lo que se trata de un diseño de pares igualados. Un conjunto de datos que nos interesa es la diferencia entre el reloj A y el reloj B para cada corredor. Vamos a definir esta variable como diferencia=BA y calcular la diferencia para cada corredor:
Corredor12345
Reloj A9.89.810.110.110.2
Reloj B10.11010.29.910.1
Diferencia (BA)0.30.20.10.20.1
Idea clave: cuando se trata de datos emparejados, estamos más interesados en la distribución de las diferencias.

Paso 2: verificar las condiciones

Queremos usar estas n=5 diferencias para construir un intervalo de confianza para la diferencia de las medias. Puesto que no conocemos la desviación estándar de la población de las diferencias, tendremos que utilizar la desviación estándar de la muestra en su lugar. Esto hace que sea necesario utilizar un intervalo t en lugar de un intervalo z para estimar la diferencia de las medias. Vamos a ver las condiciones para construir un intervalo t.
  • Aleatoriedad: la revista tomó una muestra aleatoria de sus suscriptores.
  • Normalidad: ya que nuestra muestra de n=5 corredores es pequeña, tenemos que graficar los datos. Las diferencias son aproximadamente simétricas y sin valores atípicos, por lo que debe ser seguro proceder.
  • Independencia: es razonable suponer la independencia entre las mediciones de cada corredor. Se seleccionaron al azar, y no deberían influir en los resultados de cada uno.

Paso 3: construir el intervalo

Aquí están los datos:
Corredor12345
Reloj A9.89.810.110.110.2
Reloj B10.110.010.29.910.1
Diferencia (BA)0.30.20.10.20.1
Aquí está el resumen estadístico:
Mediadesviación estándar
Reloj Ax¯A=10.00sA0.19
Reloj Bx¯B=10.06sB0.11
Diferencia (BA)x¯Dif=0.06sDif0.21
Como queremos construir un intervalo de confianza para la diferencia de las medias, solamente necesitamos el resumen estadístico de las diferencias.
Utilizaremos la fórmula para un intervalo t de una muestra para una media:
(estadístico)±(valorcrítico)(desviación estándardel estadístico)x¯Dif± tsDifn
Componentes de la fórmula:
Nuestro estadístico es la media muestral x¯Dif=0.06 km.
Nuestro tamaño de la muestra es n=5 corredores.
Nuestra desviación estándar es sDif=0.21 km.
Nuestros grados de libertad son df=51=4, así que para una confianza de 95%, nuestro valor crítico es t=2.776.
Cálculos:
x¯Dif± tsDifn0.06±2.7760.2150.06±(2.776)(0.094)0.06±0.2610.060.261=0.2010.06+0.261=0.321
Intervalo (0.20,0.32)

Paso 4: interpretar el intervalo

¿El intervalo sugiere que existe una diferencia entre los dos relojes?
Estamos seguros de que el intervalo (0.20,0.32) capta la diferencia de medias entre las distancias (en kilómetros) registrada por los relojes en este tipo de carrera. Observa que el intervalo contiene 0 km, que representa que no hay diferencia, por lo que es creíble que no existan diferencias entre las distancias medidas por el reloj A y el reloj B.
Si el intervalo completo hubiera estado encima de 0 (todos valores positivos), o si hubiera estado enteramente por debajo de 0 (todos valores negativos), se habría sugerido una diferencia entre los dos relojes.

Ejemplo 2—¡Inténtalo!

Una página web educativa ofrece un programa de práctica para el examen de admisión de la escuela de leyes (LSAT). Los usuarios del programa toman un examen de práctica y un examen final. Aquí están los resultados y ganancias para una muestra aleatoria de 6 usuarios:
Usuario123456
Práctica140152153159150146
Final150159170164148166
Mejora (finalpráctica)107175220
Aquí está el resumen estadístico:
MediaDesviación estándar
Prácticax¯práctica=150spráctica6.48
Finalx¯final=159.5sfinal8.89
Mejora (finalpráctica)x¯mejora=9.5smejora8.07
Problema A (Ejemplo 2)
Con base en esta muestra, ¿cuál es un intervalo de confianza de 95% para la mejora media de los usuarios de este programa?
Escoge 1 respuesta:

Problema B (Ejemplo 2)
¿Es creíble que los usuarios de este programa no tengan ninguna ganancia media?
Escoge 1 respuesta:

Los creadores de la página web dicen que este intervalo proporciona pruebas sólidas de que mediante su programa causan un aumento en la puntuación del LSAT de un usuario.
Problema C (Ejemplo 2)
¿Es esta es una conclusión válida?
Escoge 1 respuesta:

¿Quieres unirte a la conversación?

Sin publicaciones aún.
¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.