Contenido principal
Curso: Estadística avanzada (AP Statistics) > Unidad 9
Lección 5: Distribuciones muestrales para las diferencias en medias muestrales- Distribución muestral de la diferencia en medias muestrales
- Media y desviación estándar de la diferencia de medias muestrales
- Forma de las distribuciones muestrales para las diferencias en medias muestrales
- La distribución muestral de la diferencia de medias muestrales: ejemplo de probabilidad
- Diferencias de medias muestrales: ejemplos de probabilidad
© 2024 Khan AcademyTérminos de usoPolítica de privacidadAviso de cookies
Distribución muestral de la diferencia en medias muestrales
Podemos calcular la media y la desviación estándar para la distribución muestral de la diferencia en medias muestrales. Además, podemos decir si la forma de esa distribución muestral es aproximadamente normal. Creado por Sal Khan.
¿Quieres unirte a la conversación?
Sin publicaciones aún.
Transcripción del video
Lo que vamos a hacer en este video es explorar
la distribución muestral para una diferencia en las medias de la muestra, y usaremos este ejemplo
de aquí. Entonces nos dicen: una panadería grande prepara diariamente miles de pastelillos en dos
turnos: el turno A y el turno B. Supón que, en promedio, los pastelillos del turno A pesan 130 g,
con una desviación estándar de 4 g. Para el turno B, la media y la desviación estándar son 125 g y
3 g, respectivamente. Supón que hay independencia entre los turnos. Todos los días, la panadería
toma una muestra aleatoria siempre de 40 pastelillos de cada turno. Calculan en el peso
medio de cada muestra, luego miran la diferencia (A - B) entre las medias de la muestra. Encuentra
la probabilidad de que los pesos medios de las muestras estén separados entre sí por más de 6 g.
Ahora no te voy a pedir de inmediato que pauses el video y trates de resolverlo por tu cuenta, sino
que primero voy a pensar en cómo podemos desglosar esto y luego te pediré que hagas una pausa y
trates de resolver cada una estas partes por tu cuenta. Entonces, para abordar esta pregunta
final tendremos que considerar la media de la distribución muestral para la diferencia de las
medias muestrales; entonces, la media muestral del grupo A menos la media muestral del grupo B,
tendremos que considerar la desviación estándar de la distribución muestral para la diferencia en las
medias muestrales, y vamos a tener que pensar si esta distribución es normal. Si somos capaces de
averiguar estas tres cosas, entonces sólo tenemos que calcular a cuántas desviaciones estándar con
respecto a la media se ubica este valor y luego usar la tabla zeta para calcular la probabilidad.
Así que ahora te invito a pausar este video y tratar de resolver esta primera parte. ¿Cuál
es la media de la distribución muestral para la diferencia en las medias de las muestras? Muy
bien, ahora trabajemos juntos en esto. Entonces, la media de la distribución muestral para la
diferencia en las medias muestrales -y lo hemos visto antes- será igual a la diferencia entre
las medias de cada una de las distribuciones muestrales; entonces esta media menos esta media,
y también sabemos que cada una de estas medias de la distribución muestral corresponde a la
media de la población que estamos muestreando, así que esta media de aquí será la media de
la población para el turno A, que será de 130 g. Voy a escribirlo aquí. Y luego podemos ver
que la media de la distribución muestral de las medias para el turno B será la media poblacional
del turno B, que está justo aquí, menos 125 g, y, por supuesto, esto sólo será igual a 5 g.
Entonces, hemos respondido la primera parte: conocemos la media de la distribución muestral
de la diferencia en las medias muestrales. Ahora, ¿qué pasa con la desviación estándar?
Bueno, para esto consideremos las varianzas, porque las matemáticas son un poco más sencillas
con las varianzas, y luego podemos calcular las desviaciones estándar. Entonces sabemos que la
varianza de la distribución muestral para la diferencia de las medias muestrales, suponiendo
que las dos muestras son independientes y se está muestreando con reemplazo, al estar muestreando
con reemplazo esto es igual a la suma de las varianzas de la distribución muestral para cada
una de las medias muestrales. Ahora podrías decir: "Oye, no sabemos si estamos muestreando con
reemplazo". Bueno, sabemos que si cada uno de los tamaños de la muestra es menor al 10% de
la población, entonces esto resulta irrelevante, por lo que aún podríamos usar esta fórmula. Como
puedes ver, la muestra aleatoria siempre aquí es 40 de cada turno, y nos dicen que una gran
panadería hace diariamente miles de pastelillos en dos turnos, entonces, incluso si fueran 1000,
el 10% de eso serían 100, y 40 es menos del 10%, así que cumplimos con esa condición, por lo que
podemos usar esta fórmula que se usa cuando se muestrea con reemplazo. Entonces, esta primera
varianza aquí, de la distribución muestral para las medias muestrales del turno A, será igual a la
varianza del turno A; la varianza poblacional del turno A, dividida entre el tamaño de la muestra,
y luego será lo mismo para el turno B. La varianza del turno B, dividida entre el tamaño de la
muestra, ¿y esto a qué va a ser igual? Bueno, la varianza del turno A será el cuadrado
de la desviación estándar del turno A, la desviación estándar está justo ahí, y esto va
a ser 16. Podríamos escribir gramos al cuadrado si queremos mantener las unidades, luego vamos a
dividir entre el tamaño de la muestra. Conocemos el tamaño de la muestra en cada caso, que es de
40 pastelillos para cada muestra, y luego para el turno B sabemos que la desviación estándar
de la población para el turno B es de 3 g; si elevamos al cuadrado esto, tenemos 9 g al
cuadrado. ¡Mmm! Gramo al cuadrado suena extraño, pero esas son las unidades. El tamaño de muestra
sigue siendo igual a 40, esto será igual a, veamos: 16 + 9 = 25, el denominador común 40,
entonces 25 / 40, que es lo mismo que ⅝, ⅝g², que es una unidad un poco extraña pero esto
ahora nos dice cuál será la desviación estándar porque será la raíz cuadrada de todo esto de
acá. Entonces, la desviación estándar de la distribución muestral para la diferencia en las
medias muestrales será la raíz cuadrada de cinco octavos, y ahora, por supuesto, las unidades
han vuelto a ser gramos, lo que tiene sentido, y esto va a ser aproximadamente igual a... voy a
sacar mi calculadora: 5 dividido entre 8, y luego la raíz cuadrada de eso, será aproximadamente
0.79. Entonces, la siguiente pregunta antes de tratar de calcular la probabilidad es ¿estamos
tratando con una distribución normal cuando pensamos en la distribución muestral para la
diferencia en las medias muestrales? Así que te invito a que pauses el video de nuevo y pienses en
esto. Bueno, hay dos opciones para suponer que la distribución muestral para la diferencia en las
medias muestrales es normal. Si las poblaciones originales a partir de las cuales se calcula
cada una de las medias muestrales son normales, eso significa que la distribución muestral para
cada una de las medias muestrales será normal, lo que a su vez significa que la diferencia de
las distribuciones muestrales será normal. Ahora, no sabemos con certeza si los pesos de los
pastelillos de cada turno siguen una distribución normal, pero sabemos que la distribución
muestral de las medias muestrales puede modelarse como aproximadamente normal si los dos
tamaños de muestras son mayores o iguales a 30, y sabemos que cada una de estas muestras es
definitivamente mayor o igual a 30, son 40; entonces esto nos permite suponer que la
distribución muestral de la diferencia en las medias muestrales también es normal. Así que
hemos establecido lo que necesitábamos para poder calcular la probabilidad, por lo que nuevamente te
invito a que pauses el video y veas si puedes usar esta información para calcular la probabilidad
que resolveremos juntos en el siguiente video.