Contenido principal
Tiempo actual: 0:00Duración total:10:47

Transcripción del video

supongamos que se viene una elección y que queremos determinar si hay una diferencia significativa entre la proporción de hombres y la proporción de mujeres que van a votar por un candidato dado entonces vamos a ver a la población vamos a tomar a la población de hombres ahora con los hombres hay una cierta proporción de ellos que van a votar por el candidato vamos a llamar esa proporción p bull si va a votar y el resto de ellos no va a votar o sea 1 - p 1 la proporción uno menos que uno no va a votar con las mujeres pasa algo similar me voy a escribir por acá las mujeres en azulito entonces con las mujeres una vez más hay una cierta proporción que va a votar por el candidato que no tiene por qué ser la misma vamos a ponerle pedos entonces es así va a votar por el candidato y el resto la proporción 1 - p 2 no va a votar por el candidato no vota y este de aquí si vota 1 entonces estoy aquí son distribuciones bernouilli ya que son distribuciones ben hur y eso va a ser muy útil verdad nos va a ayudar a calcular sus medias y sus variantes vamos con los hombres entonces la media es lo mismo que la proporción de modo que la a ver no me voy a poner que la media vamos a llamarle 11 es igual ap 1 y la varianza aquí la varianza va a ser igual a esta primer no sabes que deja de usar el mismo tono de amarillo que estoy usando para hombres y voy a escribir aquí entonces la media la media es igual a peu y ahora la varianza asigna su bono al cuadrado es igual a igual al producto de estas dos probabilidades de estas dos proporciones este 1 x 1 - p 1 esto ya lo vimos varias varias veces en los videos de distribución bernouilli va a pasar lo mismo con las mujeres vamos a escribir por aquí la media de vamos a ponerle mudos es igual a pedos y la varianza vamos a ponerles sigma 2 al cuadrado es igual a otra vez bernouilli es el producto de las dos proporciones es igual la ap 2 x 1 - p 2 muy bien ahora lo que quiero hacer y creo que ya lo dije al principio del video es ver si hay una diferencia pues significativa entre la forma en la que los hombres y las mujeres optan por este candidato es decir lo que quiero hacer es preguntarme si esta diferencia 1 - p 2 es significativa entonces hay alguna diferencia significativa en esta resta de aquí bueno en este vídeo que queremos encontrar un intervalo de confianza del 95 por ciento para este parámetro de aquí es una diferencia de éstas hijos pero sigue siendo un estadístico no conocemos su valor verdadero verdad pero lo que sí podemos hacer con métodos estadísticos es sacar un intervalo del 95% de confianza de dónde va a quedar es evaluar dónde va a quedar p 1 - p 2 estadísticamente lo normal pues puedes hacer lo siguiente salimos hacemos una encuesta de mil hombres y mil mujeres y vemos los resultados para evitarnos por el momento eso de salir supongamos que ya entrevistamos a mil hombres mil hombres y obtenemos que 642 de ellos van a votar por el candidato esos son unos y el resto que son creo que 358 pero nada más no voy a poner que que los demás no van a votar por el candidato vamos a hacer lo mismo con las mujeres encuesta moza mil mujeres claro lo mejor sería entrevistar a mí que sepamos que son propensas a votar y supongamos que obtenemos que 591 de ellas dicen que votarán por el candidato y el resto dicen que no que no van a votar por ese candidato muy bien entonces pues aquí pues nomás así a simple vista basados en las proporciones parece que sí hay una diferencia verdad pero aún tenemos que obtener un intervalo de confianza vamos a ver que realmente entendemos lo que estamos haciendo lo que acabamos de hacer es encontrar una proporción muestral para los hombres entonces la proporción muestra aquí pues simplemente es una media muestral de esta pista bailable bernouilli tenemos 642 unos el resto son ceros son 642 de mil entonces la proporción muestral es la media muestral que 0.64 2 sólo podemos pensar cómo mediamos instaló como una proporción no es tal que hacemos lo mismo con las mujeres la proporción muestral va a ser igual a 0.59 10 puntos 591 podemos verlo como la media muestral de todas estas muestras que tomamos ver a 591 unos y varios ceros ahora para visualizarlo déjame dibujar la distribución muestral de las proporciones muestrales no tenemos que tenemos una muestra bien bien grande mil hombres es mucho más que 30 además nuestro parámetro quedó entre cero y uno como la mitad no cerca de cero y de uno así que no es un caso patológico entonces por la ley de grandes números puesto a ver como un anormal entonces esta distribución muestra al dejar a escribirlo por aquí la distribución muestral la distribución muestral de p ok esta distribución tiene cierta media por aquí tiene cierta media vamos a llamarle mude p parra parra y estoy aquí ya lo vimos varias veces para ser lo mismo que la media de la población y la media de la población es la proporción es la proporción así verdadera es decir es igual ap un excelente entonces la media de la distribución muestral es igual ap un vamos con la varianza esto también ya lo vimos varias veces sin made pues vamos a ponerle sigma dp1 barra y como es la varianza hay que ponerle un cuadrado es igual a por el problema del límite central va a ser igual a la varianza de esta distribución de acá arriba que esté uno por uno menos que uno dividido entre el tamaño de la muestra tenemos me mil hombres que entrevistamos podemos hacer exactamente lo mismo para las mujeres entonces una vez más voy a hacer el dibujo otra vez tenemos una muestra bien grande es la distribución muestral la distribución muestral de dp le voy a poner p2 barra es decir esa casa es que deja de poner los subíndices 1 y 1 para indicar que es para los hombres y del otro lado hay que poner la acción dos para acordarnos que de mujeres no hay que olvidarnos de los subíndices para entonces esta distribución otra vez se va a ver como normal y va a tener cierta media esta media vamos a llamarle mude p2 barra muy natural anotación entonces la media de la distribución muestral para esta proporción muestral para las mujeres es lo mismo que la media de la población que ya vimos que es igual a pedos a la proporción original de mujeres y entonces la varianza o más bien y luego la varianza de esta distribución esta distribución muestral va a ser igual ap dos a la vez que de arriba verdad es de 2 x 1 - p 2 entonces es de 2 x 1 - p 2 dividido entre el tamaño de la muestra muy bien ahora recordemos que nuestro nuestro objetivo último es encontrar el intervalo de confianza para la diferencia entonces pues vamos a pensar no en las celdas en estas excusas muestrales sino la distribución muestral de la diferencia de p1 barra la dp 1 barra y p2 barra la diferencia de estas dos proposiciones muestral es ahora cuando hablamos de proporciones es exactamente lo mismo que hacemos para las medias entonces esto es algo que ya discutimos en los videos pasados vamos a ver eso vamos a ver esa distribución muestral déjame dibujarla por acabada y bueno no sólo para dejar las cosas bien claras este fue uno que es un 0.64 2 no podemos pensar como una muestra de la distribución de la proporción muestral lo mismo acá el 0.5 91 lo podemos pensar como una muestra de la distribución muestral de pedos barra tomar muestras de la población de arriba y luego sacar su media es lo mismo que tomar una muestra de la distribución muestral de la proporción pero bueno parece trabalenguas vamos a hacer el dibujo entonces nos quedaría algo de este estilo verdad nos quedaría una vez más una normal déjame pintarla como algo de este estilo otra vez nos quedaría como campana y tendría una cierta media por aquí vamos a dar no sabes qué dejan hacerlo con otro color amarillo y azul es ver dónde lo voy a hacer en color verde entonces ahí están los que la otra vez como un anormal estoy aquí le voy a llamar la distribución muestral la distribución muestral de de este estadístico p1 barra - p 2 barra ok entonces ésta tiene cierta media tiene cierta media pude p1 barra - p 2 barra y por cosas que ya hemos hecho en vida los pasados sabemos que esta mina de aquí esta media de la diferencia de las proporciones es exactamente lo mismo que esta media - esta media que es exactamente lo mismo también que p 1 - p 2 muy bien entonces esto es igual ap uno menos y con azul voy a poner p2 muy bien pasamos a la varianza la varianza de esta distribución sigma hay que ponerle sigma cuadrada de p1 barra o inscribirse y p1 barra - p 2 barra es igual a y otra vez ya lo hicimos antes la suma de las varias de estas dos entonces va a ser igual a esta expresión de aquí que voy a copiar y pegar para no volver a escribir y está para eso tenemos que sumar esta expresión de acá la segunda varianza todavía no hay que sacar raíz verdad eso es hasta qué hacemos la desviación estándar entonces es esta variante de acá otra vez le voy a dar copias le voy a dar pega y lo pongo por acá estas dos variantes tenemos que sumar las voy a sumar en color verde me voy a poner aquí más y eso de ahí es la varianza de la diferencia de las proporciones muestrales para sacar la desviación estándar está bien fácil tachamos este 2010 y sacamos la raíz cuadrada entonces a la izquierda sacamos la raíz cuadrada obtener la desviación estándar y a la derecha también sacamos la raíz cuadrada y ya está eso de ahí nos define y nos daría la desviación estándar ahora todo esto es muy conceptual está muy abstracto pero lo que queremos hacer es ya meternos de lleno en el problema de calcular el intervalo de confianza del 95% para peón o menos que 2 esto es lo mismo que encontrar un intervalo del 95% de confianza para la media de la diferencia como me estoy haciendo el propósito de no hacer los vídeos muy largos vamos a dejar la siguiente parte la de encontrar el intervalo de confianza para el siguiente vídeo nos vemos