Contenido principal
Estadística y probabilidad
Curso: Estadística y probabilidad > Unidad 12
Lección 3: Pruebas sobre una proporción de la población- Construir hipótesis para una prueba de significancia de una proporción
- Escribir hipótesis para una prueba de una proporción
- Las condiciones para una prueba z de una proporción
- Referencia: condiciones para la inferencia en una proporción
- Las condiciones para una prueba z de una proporción
- Calcular un estadístico z en una prueba de una proporción
- Calcular el estadístico de prueba en una prueba z para una proporción
- Calcular un valor p dado un estadístico z
- Calcular el valor p en una prueba z para una proporción
- Hacer conclusiones en una prueba sobre una proporción
- Hacer conclusiones en una prueba z para una proporción
© 2023 Khan AcademyTérminos de usoPolítica de privacidadAviso de cookies
Referencia: condiciones para la inferencia en una proporción
Cuando queremos realizar inferencias en una proporción (construir un intervalo de confianza o hacer una prueba de significancia), la exactitud de nuestros métodos depende de algunas condiciones. Antes de hacer los cómputos reales del intervalo o de la prueba, es importante comprobar si se cumplen estas condiciones, de lo contrario los cálculos y conclusiones que siguen no son realmente válidos.
Las condiciones que necesitamos para la inferencia en una proporción son:
- Aleatoriedad: los datos necesitan venir de una muestra aleatoria o de un experimento aleatorizado.
- Normalidad: la distribución muestral de
debe ser aproximadamente normal, se necesitan por lo menos éxitos esperados y fracasos esperados. - Independencia: las observaciones individuales deben ser independientes. Si el muestreo es sin reemplazo, nuestro tamaño de la muestra no debe ser mayor del
de la población.
Echemos un vistazo a cada una de estas condiciones un poco más a fondo.
La condición de aleatoriedad
Las muestras aleatorias nos dan datos imparciales de una población. Cuando las muestras no se seleccionan aleatoriamente, los datos suelen tener algún tipo de sesgo, así que usar datos que no se seleccionan aleatoriamente para hacer inferencias sobre la población puede ser riesgoso.
Concretamente, las proporciones muestrales son estimadores insesgados de su proporción poblacional. Por ejemplo, si tenemos una bolsa de dulces donde el son anaranjados y tomamos muestras aleatorias de la bolsa, algunas tendrán más de de caramelos anaranjados y algunas tendrán menos. Pero en promedio, la proporción de dulces anaranjados en cada muestra será igual a . Escribimos esta propiedad como , que es válido siempre y cuando nuestra muestra sea aleatoria.
Esto no necesariamente ocurrirá si nuestra muestra no se selecciona aleatoriamente. Las muestras sesgadas conducen a resultados inexactos, por lo que no se deben usar para crear intervalos de confianza o realizar pruebas de significancia.
La condición de normalidad
La distribución muestral de es aproximadamente normal siempre y cuando el número esperado de éxitos y fracasos sean al menos cada uno. Esto sucede cuando el tamaño de la muestra es razonablemente grande. La prueba de esto está fuera del alcance de AP statistics (Estadística AP), pero nuestra lección sobre distribuciones muestrales puede proporcionar cierta intuición y verificación de que esta condición de hecho funciona.
Por lo que necesitamos:
Si construimos un intervalo de confianza, no tenemos un valor de que sustituir, por lo que en su lugar contamos el número observado de éxitos y fracasos en los datos muestrales para asegurar que ambos sean al menos . Si hacemos una prueba de significancia, usamos el tamaño de la muestra y el valor hipotético de para calcular nuestro número esperado de éxitos y fracasos.
La condición de independencia
Para usar la fórmula para la desviación estándar de , necesitamos que las observaciones individuales sean independientes. Cuando hacemos un muestreo sin reemplazo, las observaciones individuales no son técnicamente independientes puesto que quitar cada elemento cambia la población.
Pero la condición del dice que si nuestra muestra es el de la población o menos, podemos tratar las observaciones individuales como independientes, ya que quitar cada observación no cambia significativamente la población mientras muestreamos. Por ejemplo, si nuestro tamaño de la muestra es , debería haber al menos miembros en la población.
Esto nos permite utilizar la fórmula para la desviación estándar de :
En una prueba de significancia, usamos el tamaño de la muestra y el valor hipotético de
Si construimos un intervalo de confianza para , realmente no sabemos el valor de , por lo que sustituimos como una estimación de . Cuando hacemos esto, lo llamamos el error estándar de para distinguirlo de la desviación estándar.
Así que nuestra fórmula para el error estándar de es
¿Quieres unirte a la conversación?
Sin publicaciones aún.