If you're seeing this message, it means we're having trouble loading external resources on our website.

Si estás detrás de un filtro de páginas web, por favor asegúrate de que los dominios *.kastatic.org y *.kasandbox.org estén desbloqueados.

Contenido principal

Referencia: condiciones para la inferencia en una proporción

Cuando queremos realizar inferencias en una proporción (construir un intervalo de confianza o hacer una prueba de significancia), la exactitud de nuestros métodos depende de algunas condiciones. Antes de hacer los cómputos reales del intervalo o de la prueba, es importante comprobar si se cumplen estas condiciones, de lo contrario los cálculos y conclusiones que siguen no son realmente válidos.
Las condiciones que necesitamos para la inferencia en una proporción son:
  • Aleatoriedad: los datos necesitan venir de una muestra aleatoria o de un experimento aleatorizado.
  • Normalidad: la distribución muestral de p, with, hat, on top debe ser aproximadamente normal, se necesitan por lo menos 10 éxitos esperados y 10 fracasos esperados.
  • Independencia: las observaciones individuales deben ser independientes. Si el muestreo es sin reemplazo, nuestro tamaño de la muestra no debe ser mayor del 10, percent de la población.
Echemos un vistazo a cada una de estas condiciones un poco más a fondo.

La condición de aleatoriedad

Las muestras aleatorias nos dan datos imparciales de una población. Cuando las muestras no se seleccionan aleatoriamente, los datos suelen tener algún tipo de sesgo, así que usar datos que no se seleccionan aleatoriamente para hacer inferencias sobre la población puede ser riesgoso.
Concretamente, las proporciones muestrales son estimadores insesgados de su proporción poblacional. Por ejemplo, si tenemos una bolsa de dulces donde el 50, percent son anaranjados y tomamos muestras aleatorias de la bolsa, algunas tendrán más de 50, percent de caramelos anaranjados y algunas tendrán menos. Pero en promedio, la proporción de dulces anaranjados en cada muestra será igual a 50, percent. Escribimos esta propiedad como mu, start subscript, p, with, hat, on top, end subscript, equals, p, que es válido siempre y cuando nuestra muestra sea aleatoria.
Esto no necesariamente ocurrirá si nuestra muestra no se selecciona aleatoriamente. Las muestras sesgadas conducen a resultados inexactos, por lo que no se deben usar para crear intervalos de confianza o realizar pruebas de significancia.

La condición de normalidad

La distribución muestral de p, with, hat, on top es aproximadamente normal siempre y cuando el número esperado de éxitos y fracasos sean al menos 10 cada uno. Esto sucede cuando el tamaño de la muestra n es razonablemente grande. La prueba de esto está fuera del alcance de AP statistics (Estadística AP), pero nuestra lección sobre distribuciones muestrales puede proporcionar cierta intuición y verificación de que esta condición de hecho funciona.
Por lo que necesitamos:
eˊxitos esperados: np10fracasos esperados: n(1p)10\begin{aligned} &\text{éxitos esperados: } np \geq 10 \\\\ &\text{fracasos esperados: } n(1-p) \geq 10 \end{aligned}
Si construimos un intervalo de confianza, no tenemos un valor de p que sustituir, por lo que en su lugar contamos el número observado de éxitos y fracasos en los datos muestrales para asegurar que ambos sean al menos 10. Si hacemos una prueba de significancia, usamos el tamaño de la muestra n y el valor hipotético de p para calcular nuestro número esperado de éxitos y fracasos.

La condición de independencia

Para usar la fórmula para la desviación estándar de p, with, hat, on top, necesitamos que las observaciones individuales sean independientes. Cuando hacemos un muestreo sin reemplazo, las observaciones individuales no son técnicamente independientes puesto que quitar cada elemento cambia la población.
Pero la condición del 10, percent dice que si nuestra muestra es el 10, percent de la población o menos, podemos tratar las observaciones individuales como independientes, ya que quitar cada observación no cambia significativamente la población mientras muestreamos. Por ejemplo, si nuestro tamaño de la muestra es n, equals, 150, debería haber al menos N, equals, 1500 miembros en la población.
Esto nos permite utilizar la fórmula para la desviación estándar de p, with, hat, on top:
sigma, start subscript, p, with, hat, on top, end subscript, equals, square root of, start fraction, p, left parenthesis, 1, minus, p, right parenthesis, divided by, n, end fraction, end square root
En una prueba de significancia, usamos el tamaño de la muestra n y el valor hipotético de p
Si construimos un intervalo de confianza para p, realmente no sabemos el valor de p, por lo que sustituimos p, with, hat, on top como una estimación de p. Cuando hacemos esto, lo llamamos el error estándar de p, with, hat, on top para distinguirlo de la desviación estándar.
Así que nuestra fórmula para el error estándar de p, with, hat, on top es
sigma, start subscript, p, with, hat, on top, end subscript, approximately equals, square root of, start fraction, p, with, hat, on top, left parenthesis, 1, minus, p, with, hat, on top, right parenthesis, divided by, n, end fraction, end square root

¿Quieres unirte a la conversación?

Sin publicaciones aún.
¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.