If you're seeing this message, it means we're having trouble loading external resources on our website.

Si estás detrás de un filtro de páginas web, por favor asegúrate de que los dominios *.kastatic.org y *.kasandbox.org estén desbloqueados.

Contenido principal

Distribución muestral de la diferencia en medias muestrales

Podemos calcular la media y la desviación estándar para la distribución muestral de la diferencia en medias muestrales. Además, podemos decir si la forma de esa distribución muestral es aproximadamente normal. Creado por Sal Khan.

¿Quieres unirte a la conversación?

Sin publicaciones aún.
¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.

Transcripción del video

Lo que vamos a hacer en este video es explorar  la distribución muestral para una diferencia en   las medias de la muestra, y usaremos este ejemplo  de aquí. Entonces nos dicen: una panadería grande   prepara diariamente miles de pastelillos en dos  turnos: el turno A y el turno B. Supón que, en   promedio, los pastelillos del turno A pesan 130 g,  con una desviación estándar de 4 g. Para el turno   B, la media y la desviación estándar son 125 g y  3 g, respectivamente. Supón que hay independencia   entre los turnos. Todos los días, la panadería  toma una muestra aleatoria siempre de 40   pastelillos de cada turno. Calculan en el peso  medio de cada muestra, luego miran la diferencia   (A - B) entre las medias de la muestra. Encuentra  la probabilidad de que los pesos medios de las   muestras estén separados entre sí por más de 6 g.  Ahora no te voy a pedir de inmediato que pauses el   video y trates de resolverlo por tu cuenta, sino  que primero voy a pensar en cómo podemos desglosar   esto y luego te pediré que hagas una pausa y  trates de resolver cada una estas partes por   tu cuenta. Entonces, para abordar esta pregunta  final tendremos que considerar la media de la   distribución muestral para la diferencia de las  medias muestrales; entonces, la media muestral   del grupo A menos la media muestral del grupo B,  tendremos que considerar la desviación estándar de   la distribución muestral para la diferencia en las  medias muestrales, y vamos a tener que pensar si   esta distribución es normal. Si somos capaces de  averiguar estas tres cosas, entonces sólo tenemos   que calcular a cuántas desviaciones estándar con  respecto a la media se ubica este valor y luego   usar la tabla zeta para calcular la probabilidad.  Así que ahora te invito a pausar este video y   tratar de resolver esta primera parte. ¿Cuál  es la media de la distribución muestral para   la diferencia en las medias de las muestras? Muy  bien, ahora trabajemos juntos en esto. Entonces,   la media de la distribución muestral para la  diferencia en las medias muestrales -y lo hemos   visto antes- será igual a la diferencia entre  las medias de cada una de las distribuciones   muestrales; entonces esta media menos esta media,  y también sabemos que cada una de estas medias   de la distribución muestral corresponde a la  media de la población que estamos muestreando,   así que esta media de aquí será la media de  la población para el turno A, que será de 130   g. Voy a escribirlo aquí. Y luego podemos ver  que la media de la distribución muestral de las   medias para el turno B será la media poblacional  del turno B, que está justo aquí, menos 125 g,   y, por supuesto, esto sólo será igual a 5 g.  Entonces, hemos respondido la primera parte:   conocemos la media de la distribución muestral  de la diferencia en las medias muestrales. Ahora,   ¿qué pasa con la desviación estándar?  Bueno, para esto consideremos las varianzas,   porque las matemáticas son un poco más sencillas  con las varianzas, y luego podemos calcular las   desviaciones estándar. Entonces sabemos que la  varianza de la distribución muestral para la   diferencia de las medias muestrales, suponiendo  que las dos muestras son independientes y se está   muestreando con reemplazo, al estar muestreando  con reemplazo esto es igual a la suma de las   varianzas de la distribución muestral para cada  una de las medias muestrales. Ahora podrías decir:   "Oye, no sabemos si estamos muestreando con  reemplazo". Bueno, sabemos que si cada uno   de los tamaños de la muestra es menor al 10% de  la población, entonces esto resulta irrelevante,   por lo que aún podríamos usar esta fórmula. Como  puedes ver, la muestra aleatoria siempre aquí   es 40 de cada turno, y nos dicen que una gran  panadería hace diariamente miles de pastelillos   en dos turnos, entonces, incluso si fueran 1000,  el 10% de eso serían 100, y 40 es menos del 10%,   así que cumplimos con esa condición, por lo que  podemos usar esta fórmula que se usa cuando se   muestrea con reemplazo. Entonces, esta primera  varianza aquí, de la distribución muestral para   las medias muestrales del turno A, será igual a la  varianza del turno A; la varianza poblacional del   turno A, dividida entre el tamaño de la muestra,  y luego será lo mismo para el turno B. La varianza   del turno B, dividida entre el tamaño de la  muestra, ¿y esto a qué va a ser igual? Bueno,   la varianza del turno A será el cuadrado  de la desviación estándar del turno A,   la desviación estándar está justo ahí, y esto va  a ser 16. Podríamos escribir gramos al cuadrado   si queremos mantener las unidades, luego vamos a  dividir entre el tamaño de la muestra. Conocemos   el tamaño de la muestra en cada caso, que es de  40 pastelillos para cada muestra, y luego para el   turno B sabemos que la desviación estándar  de la población para el turno B es de 3 g;   si elevamos al cuadrado esto, tenemos 9 g al  cuadrado. ¡Mmm! Gramo al cuadrado suena extraño,   pero esas son las unidades. El tamaño de muestra  sigue siendo igual a 40, esto será igual a,   veamos: 16 + 9 = 25, el denominador común 40,  entonces 25 / 40, que es lo mismo que ⅝, ⅝g²,   que es una unidad un poco extraña pero esto  ahora nos dice cuál será la desviación estándar   porque será la raíz cuadrada de todo esto de  acá. Entonces, la desviación estándar de la   distribución muestral para la diferencia en las  medias muestrales será la raíz cuadrada de cinco   octavos, y ahora, por supuesto, las unidades  han vuelto a ser gramos, lo que tiene sentido,   y esto va a ser aproximadamente igual a... voy a  sacar mi calculadora: 5 dividido entre 8, y luego   la raíz cuadrada de eso, será aproximadamente  0.79. Entonces, la siguiente pregunta antes de   tratar de calcular la probabilidad es ¿estamos  tratando con una distribución normal cuando   pensamos en la distribución muestral para la  diferencia en las medias muestrales? Así que te   invito a que pauses el video de nuevo y pienses en  esto. Bueno, hay dos opciones para suponer que la   distribución muestral para la diferencia en las  medias muestrales es normal. Si las poblaciones   originales a partir de las cuales se calcula  cada una de las medias muestrales son normales,   eso significa que la distribución muestral para  cada una de las medias muestrales será normal,   lo que a su vez significa que la diferencia de  las distribuciones muestrales será normal. Ahora,   no sabemos con certeza si los pesos de los  pastelillos de cada turno siguen una distribución   normal, pero sabemos que la distribución  muestral de las medias muestrales puede   modelarse como aproximadamente normal si los dos  tamaños de muestras son mayores o iguales a 30,   y sabemos que cada una de estas muestras es  definitivamente mayor o igual a 30, son 40;   entonces esto nos permite suponer que la  distribución muestral de la diferencia en   las medias muestrales también es normal. Así que  hemos establecido lo que necesitábamos para poder   calcular la probabilidad, por lo que nuevamente te  invito a que pauses el video y veas si puedes usar   esta información para calcular la probabilidad  que resolveremos juntos en el siguiente video.