Contenido principal
Estadística avanzada (AP Statistics)
Curso: Estadística avanzada (AP Statistics) > Unidad 11
Lección 3: Probar hipótesis sobre una proporción- Construir hipótesis para una prueba de significancia de una proporción
- Escribir hipótesis para una prueba de una proporción
- Las condiciones para una prueba z de una proporción
- Referencia: condiciones para la inferencia en una proporción
- Las condiciones para una prueba z de una proporción
- Calcular un estadístico z en una prueba de una proporción
- Calcular el estadístico de prueba en una prueba z para una proporción
- Calcular un valor p dado un estadístico z
- Calcular el valor p en una prueba z para una proporción
- Hacer conclusiones en una prueba sobre una proporción
- Hacer conclusiones en una prueba z para una proporción
- La prueba de significancia para una proporción. Ejemplo de respuesta libre
- La prueba de significancia para una proporción. Respuesta libre (parte 2 con corrección)
© 2023 Khan AcademyTérminos de usoPolítica de privacidadAviso de cookies
Referencia: condiciones para la inferencia en una proporción
Cuando queremos realizar inferencias en una proporción (construir un intervalo de confianza o hacer una prueba de significancia), la exactitud de nuestros métodos depende de algunas condiciones. Antes de hacer los cómputos reales del intervalo o de la prueba, es importante comprobar si se cumplen estas condiciones, de lo contrario los cálculos y conclusiones que siguen no son realmente válidos.
Las condiciones que necesitamos para la inferencia en una proporción son:
- Aleatoriedad: los datos necesitan venir de una muestra aleatoria o de un experimento aleatorizado.
- Normalidad: la distribución muestral de p, with, hat, on top debe ser aproximadamente normal, se necesitan por lo menos 10 éxitos esperados y 10 fracasos esperados.
- Independencia: las observaciones individuales deben ser independientes. Si el muestreo es sin reemplazo, nuestro tamaño de la muestra no debe ser mayor del 10, percent de la población.
Echemos un vistazo a cada una de estas condiciones un poco más a fondo.
La condición de aleatoriedad
Las muestras aleatorias nos dan datos imparciales de una población. Cuando las muestras no se seleccionan aleatoriamente, los datos suelen tener algún tipo de sesgo, así que usar datos que no se seleccionan aleatoriamente para hacer inferencias sobre la población puede ser riesgoso.
Concretamente, las proporciones muestrales son estimadores insesgados de su proporción poblacional. Por ejemplo, si tenemos una bolsa de dulces donde el 50, percent son anaranjados y tomamos muestras aleatorias de la bolsa, algunas tendrán más de 50, percent de caramelos anaranjados y algunas tendrán menos. Pero en promedio, la proporción de dulces anaranjados en cada muestra será igual a 50, percent. Escribimos esta propiedad como mu, start subscript, p, with, hat, on top, end subscript, equals, p, que es válido siempre y cuando nuestra muestra sea aleatoria.
Esto no necesariamente ocurrirá si nuestra muestra no se selecciona aleatoriamente. Las muestras sesgadas conducen a resultados inexactos, por lo que no se deben usar para crear intervalos de confianza o realizar pruebas de significancia.
La condición de normalidad
La distribución muestral de p, with, hat, on top es aproximadamente normal siempre y cuando el número esperado de éxitos y fracasos sean al menos 10 cada uno. Esto sucede cuando el tamaño de la muestra n es razonablemente grande. La prueba de esto está fuera del alcance de AP statistics (Estadística AP), pero nuestra lección sobre distribuciones muestrales puede proporcionar cierta intuición y verificación de que esta condición de hecho funciona.
Por lo que necesitamos:
Si construimos un intervalo de confianza, no tenemos un valor de p que sustituir, por lo que en su lugar contamos el número observado de éxitos y fracasos en los datos muestrales para asegurar que ambos sean al menos 10. Si hacemos una prueba de significancia, usamos el tamaño de la muestra n y el valor hipotético de p para calcular nuestro número esperado de éxitos y fracasos.
La condición de independencia
Para usar la fórmula para la desviación estándar de p, with, hat, on top, necesitamos que las observaciones individuales sean independientes. Cuando hacemos un muestreo sin reemplazo, las observaciones individuales no son técnicamente independientes puesto que quitar cada elemento cambia la población.
Pero la condición del 10, percent dice que si nuestra muestra es el 10, percent de la población o menos, podemos tratar las observaciones individuales como independientes, ya que quitar cada observación no cambia significativamente la población mientras muestreamos. Por ejemplo, si nuestro tamaño de la muestra es n, equals, 150, debería haber al menos N, equals, 1500 miembros en la población.
Esto nos permite utilizar la fórmula para la desviación estándar de p, with, hat, on top:
En una prueba de significancia, usamos el tamaño de la muestra n y el valor hipotético de p
Si construimos un intervalo de confianza para p, realmente no sabemos el valor de p, por lo que sustituimos p, with, hat, on top como una estimación de p. Cuando hacemos esto, lo llamamos el error estándar de p, with, hat, on top para distinguirlo de la desviación estándar.
Así que nuestra fórmula para el error estándar de p, with, hat, on top es
¿Quieres unirte a la conversación?
Sin publicaciones aún.