If you're seeing this message, it means we're having trouble loading external resources on our website.

Si estás detrás de un filtro de páginas web, por favor asegúrate de que los dominios *.kastatic.org y *.kasandbox.org estén desbloqueados.

Contenido principal

Referencia: condiciones para la inferencia en una proporción

Cuando queremos realizar inferencias en una proporción (construir un intervalo de confianza o hacer una prueba de significancia), la exactitud de nuestros métodos depende de algunas condiciones. Antes de hacer los cómputos reales del intervalo o de la prueba, es importante comprobar si se cumplen estas condiciones, de lo contrario los cálculos y conclusiones que siguen no son realmente válidos.
Las condiciones que necesitamos para la inferencia en una proporción son:
  • Aleatoriedad: los datos necesitan venir de una muestra aleatoria o de un experimento aleatorizado.
  • Normalidad: la distribución muestral de p^ debe ser aproximadamente normal, se necesitan por lo menos 10 éxitos esperados y 10 fracasos esperados.
  • Independencia: las observaciones individuales deben ser independientes. Si el muestreo es sin reemplazo, nuestro tamaño de la muestra no debe ser mayor del 10% de la población.
Echemos un vistazo a cada una de estas condiciones un poco más a fondo.

La condición de aleatoriedad

Las muestras aleatorias nos dan datos imparciales de una población. Cuando las muestras no se seleccionan aleatoriamente, los datos suelen tener algún tipo de sesgo, así que usar datos que no se seleccionan aleatoriamente para hacer inferencias sobre la población puede ser riesgoso.
Concretamente, las proporciones muestrales son estimadores insesgados de su proporción poblacional. Por ejemplo, si tenemos una bolsa de dulces donde el 50% son anaranjados y tomamos muestras aleatorias de la bolsa, algunas tendrán más de 50% de caramelos anaranjados y algunas tendrán menos. Pero en promedio, la proporción de dulces anaranjados en cada muestra será igual a 50%. Escribimos esta propiedad como μp^=p, que es válido siempre y cuando nuestra muestra sea aleatoria.
Esto no necesariamente ocurrirá si nuestra muestra no se selecciona aleatoriamente. Las muestras sesgadas conducen a resultados inexactos, por lo que no se deben usar para crear intervalos de confianza o realizar pruebas de significancia.

La condición de normalidad

La distribución muestral de p^ es aproximadamente normal siempre y cuando el número esperado de éxitos y fracasos sean al menos 10 cada uno. Esto sucede cuando el tamaño de la muestra n es razonablemente grande. La prueba de esto está fuera del alcance de AP statistics (Estadística AP), pero nuestra lección sobre distribuciones muestrales puede proporcionar cierta intuición y verificación de que esta condición de hecho funciona.
Por lo que necesitamos:
éxitos esperados: np10fracasos esperados: n(1p)10
Si construimos un intervalo de confianza, no tenemos un valor de p que sustituir, por lo que en su lugar contamos el número observado de éxitos y fracasos en los datos muestrales para asegurar que ambos sean al menos 10. Si hacemos una prueba de significancia, usamos el tamaño de la muestra n y el valor hipotético de p para calcular nuestro número esperado de éxitos y fracasos.

La condición de independencia

Para usar la fórmula para la desviación estándar de p^, necesitamos que las observaciones individuales sean independientes. Cuando hacemos un muestreo sin reemplazo, las observaciones individuales no son técnicamente independientes puesto que quitar cada elemento cambia la población.
Pero la condición del 10% dice que si nuestra muestra es el 10% de la población o menos, podemos tratar las observaciones individuales como independientes, ya que quitar cada observación no cambia significativamente la población mientras muestreamos. Por ejemplo, si nuestro tamaño de la muestra es n=150, debería haber al menos N=1500 miembros en la población.
Esto nos permite utilizar la fórmula para la desviación estándar de p^:
σp^=p(1p)n
En una prueba de significancia, usamos el tamaño de la muestra n y el valor hipotético de p
Si construimos un intervalo de confianza para p, realmente no sabemos el valor de p, por lo que sustituimos p^ como una estimación de p. Cuando hacemos esto, lo llamamos el error estándar de p^ para distinguirlo de la desviación estándar.
Así que nuestra fórmula para el error estándar de p^ es
σp^p^(1p^)n

¿Quieres unirte a la conversación?

¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.