Contenido principal
Tiempo actual: 0:00Duración total:15:15

Transcripción del video

hemos visto que los últimos vídeos tomamos una distribución loca o pan también puede ser una distribución normal pero no es necesario que tener una distribución normal digamos que tenemos esta distribución local cómo se dibuja no acá y hemos visto varias veces que tomamos muestras de esta distribución todas loca digamos que vamos a tomar el que m el número de muestras es igual a 10 así que tomamos 10 instancias de esta variable aleatoria sacado su promedio y dibujamos nuestro promedio al dibujar el promedio tenemos una instancia cav y hacemos esto una y otra vez obtenemos diez muestras de esa variable aleatorias a cabo su promedio la dibujábamos y eventualmente cuando hacemos esto muchas pero muchas veces en teoría un número infinito de veces vamos a aproximarnos a la distribución de muestreo de la media de la muestra con ella igual a 10 no va a ser una distribución normal perfecta pero va a ser bastante aproximada sería perfecta sólo sí y me fuera igual infinito así que eventualmente todas nuestras muestras van a seguir gráfica no sé y acumulándose más o menos así y eventualmente se tendrá algo que luce más o menos así y el video anterior vimos qué bueno si queremos hacerlo de nuevo pero esta vez con n igual a 20 la distribución que vamos a obtener va a ser mucho más normal y en futuros vídeos veremos más a detalle los conceptos de sesgo y curtósis así pues esta distribución con en igual a 20 va a ser mucho más normal y algo mucho más interesante es que va a tener una desviación estándar bastante más pequeña digamos que la media de esta variable lator ya es no se hincó la media a quien también va a ser cinco la media de la distribución de muestreo de la media de la muestra también va a ser cinco y aquí no importa cuál sea el valor de n esta media de la muestra también va a ser cinco pero nuestra definición estándar va a ser mucho más pequeña que cualquiera de las dos anteriores así que puede lucir más o menos así si lo hiciéramos con una muestra todavía más grande vamos a ponerle un color diferente una muestra con en igual a 100 lo que vamos a tener es algo que se acerque todavía aún más a una distribución normal tomamos 100 muestras de esta distribución las prometíamos y las dibujamos y así lo seguiremos haciendo y si no seguimos haciendo lo que vamos a tener es a lo que es aún más normal que las anteriores mucho más cercana una verdadera distribución normal pero lo más obvio a la vista es que va a tener una definición estándar todavía más pequeña por lo que va a tener una desviación estándar mucho mucho más pequeña que haber algo más o menos así y veremos cómo se hace esto en una aplicación de simulación que vemos en el siguiente vídeo o la mejor después en este mismo video así que dos cosas suceden conforme aumentamos el número de muestras dos cosas suceden una nos volvemos van normales y nuestra dirección estándar se hace más pequeño así que la pregunta que surge es existe una fórmula si yo sé que la desviación estándar esas medidas de acción están de mi función de distribución de probabilidad original y esa es la media conozco la desviación estándar y conozco n que va a estar cambiando conforme yo vaya aumentando el número de muestras si yo conozco la división estándar y conozco n a lo mejor también conozco la varianza ya que es la desviación estándar al cuadrado si no recuerden esto puede revisar los videos anteriores de estadística pero si yo conozco la alianza de distribución original y si yo conozco cuál es mi m cuantas muestras voy a tomar cada vez que haga un promedio de ellas para poder graficar las en la distribución de muestreo de la media de la muestra habrá alguna manera de predecir cuál será la media de estas distribuciones pero cuál será la desviación estándar de estas distribuciones y para no confundirnos vamos a hablar mejor de la varianza ya que podemos encontrar la desviación estándar a partir de ésta esta es la varianza de nuestra distribución original ahora para mostrar que ésta es la varianza de nuestra distribución de muestreo de la media de la muestra lo escribí aquí es la varianza de nuestra media la media de nuestra muestra recordemos que esta es nuestra media verdadera esta letra muy griega es la media real es igual a la media mientras que la x con la línea encima de nuestra media de la muestra lo que aquí estamos diciendo es que si aquí tenemos la varianza de nuestro medio de la muestra es hacer una distribución verdadera si nosotros conocíamos de antemano esta distribución ésta tendría una variante ésta tiene una media y eso también es otra media si hacemos bien nuestro anotación esta va a ser la media de la distribución de muestreo de la media de la muestra así que esta es la media de nuestras vez y resulta que son las mismas esta es la media también de nuestras muestras y también va a ser la misma el punto de este vídeo se encontrase alguna manera de calcular esta variante zarza conociendo la varianza de nuestra distribución original y el número de elementos de la muestra y pues qué creen resulta que sí la hay no voy a desarrollar la prueba aquí pero les voy a dar la inclusión de ello ya que ustedes saben que por cada prueba que se hace si ustedes toman sin muestras es mucho más probable que ustedes lleguen a la media verdad era que si tienen una n de dos o de 5 es muy poco probable que ustedes puedan llegar a esta media así que yo creo que ustedes intuyen que el llegar a la media es inversamente proporcional al tamaño de la muestra n mientras más grande sea nuestra m más pequeña será la desviación estándar y resulta que esto es muy sencillo no los voy a hacer la prueba formal si no les voy a dar el conocimiento para que ustedes puedan usar siempre en estadística dudó en ciudades primero la definición formal o darles el conocimiento más práctico pero siempre me decido por darles el conocimiento práctico ya que es lo que más se usa las pruebas experimentales creo que es lo que necesitan en estos momentos ya tiempo más adelante para las definiciones formales resulta que la varianza de la distribución de muestreo de la media de la muestra va a ser igual a la varianza de la distribución original esta beca dividida entre amy que más sencillo pueda ver si eso de que arriba tiene una variante sadem 20 más que aumentar este número y nuestra n también es igual a 20 entonces la varianza de la distribución de muestreo de la media de la muestra para una igualmente y con esta variante de 2020 entre 20 pues va a ser igual a una así que nuestra alianza es igual a 20 entre 20 y walt aún no es la varianza de distribución original y ésta va a ser la varianza de la media de la muestra y nuestra división esta va a ser la raíz cuadrada de esto la raíz cuadrada de uno queda en 1 así que nuestra fórmula que daría si sacamos la raíz cuadrada en ambos lados y nos queda que la desviación estándar de la distribución de muestreo de la media de la muestra que normalmente se le llama a la desviación estándar de la media también se le conoce y eso lo voy a escribir acá el error estándar de la media error es tandas de la media todas estas cosas que acabo de mencionar significan la desviación estándar de la distribución de muestreo de la media de la muestra sé que esto es un poco confuso ya que siempre usa las palabras media y muestra lo bueno de tener el video es que ustedes se pueden poner pausa en cualquier momento para ese momento y comprender bien de lo que les estoy hablando lo importante es que sacamos la raíz cuadrada en ambos lados de esta ecuación nos quedará que la desviación estándar de la distribución de muestreo de la media de la muestra va a ser igual a la desviación estándar de nuestra distribución original dividida entre la raíz cuadrada de en aquí obtuve la raíz cuadrada el numerador y denominador personalmente prefiero recordar esta fórmula de acá que esta otra y a partir de esta deducir la de abajo ya que es mucho más directo para mí recordar lo que es la varianza y que es igual a la varianza entre el número de las muestras / m así que aquí las regiones tender cuando en es igual a 1 la desviación estándar de la distribución de muestreo de la media de la muestra es igual a 1 y aquí cuando en es igual a 100 nuestra alianza de la distribución de muestreo de la media de la muestra o la varianza de la media va a ser igual a 20 que es la varianza de aquí arriba del original entre 100 esto es igual a un quinto la definición estándar de nuevo de la distribución de muestreo de la media de la muestra o el error estándar de la media va a ser igual a la raíz cuadrada de un quinto igual a 1 entre la raíz cuadrada de cinco así que esta parte de cada vez más en menos de un medio en la desviación estándar en comparación de la de quique definición estándar es igual a uno y cómo pueden ver es mucho más delgada y ustedes pueden decirme bueno mira tu mensaje una fórmula pero no necesariamente tiene por qué crees bueno vamos a ver si podemos probar esto de manera práctica y para eso vamos a hacer una simulación vamos a cambiar esta distribución vamos a hacer un poco más loca así y así es mi nueva distribución y vamos a tomar una m que sea fácil de encontrar su raíz cuadrada vamos a tomar una n 16 y otra m de 25 iban a hacer diez mil muestras o 10 mil intentos tomamos nuestras 16 muestras hacemos el promedio lo dejamos aquí y eso lo repetimos 10.000 veces aquí abajo vamos a tomar 25 muestras las prometíamos y las gráficas nos vamos a hacer una animación simplemente para recordar cómo es esto aquí está 16 muestras se promedia y aquí se grafica otras 25 muestras se promedian y geográfica si yo repito esto 10 mil veces que lo que voy a obtener esa aquí está el resultado visualmente se pueden dar cuenta que cuando la m es mayor la desviación estándar es más chica aquí está más delgadito pero bueno vamos a escribir esto a ver si nos podemos acordar en esta distribución estándar que acabo de hacer mi desviación estándar es de 9.3 voy a acordarme de esto la resolución estándar originales 9.3 la edición estándar de aquí a ese 2.33 y la desviación estándar de aquí abajo es de 1.87 vamos a ver si podemos confirmar esta fórmula que les comenté hace un momento vamos a quitar esto de la pantalla por un momento y acordarnos de los valores aquí vamos a hacer espacio en la prueba que vamos a hacer de mi instrucción todas loca tenía una desviación estándar de 9.3 cuando m es igual a 16 igual a 16 cuando hicimos muchas pruebas obtuvimos la decisión estándar de la distribución de nuestro de la media de la muestra o la desviación estándar del error experimentalmente determinamos que esta decisión es de 2.83 y cuando ven es igual a 25 lo ponemos en otro color tenemos que el error estándar de la media es igual a 1.87 y recordemos nuestra fórmula sabemos que la varianza de la media o el error estándar o la varianza de la distribución de muestreo de la media de la muestra es igual a la varianza de nuestra distribución original dividida entre m sacamos la raíz cuadrada en ambos lados de la ecuación y nos queda el error estándar de la media es igual a la definición estándar de la distribución original dividida entre la raíz cuadrada de m sustituimos estos valores para cuando en el siglo 16 vamos a este caso 9.3 entre la raíz cuadrada de 16 que es 44 por 416 9.64 cual bases o 9.3 dividido entre 4 usamos nuestra confiable calculadora y vamos a tener 9.3 entre raíz cuadrada de cuatro pero en la escuadra de 16 42 grados punto 32 5 lo redondeamos a 2.32 esto es igual a 2.32 lo que es muy cercano a él 2.33 éste que obtuvimos realizando 10 mil muestras igual podríamos ver qué pasa con esto si hacemos 100 mil muestras o 200 mil muestras ahora vamos a ver este otro aquí tenemos 9.3 bueno vamos a dividir esto y hacer espacio tomamos nuestras decisiones tanda de la distribución original esta fórmula de aquí que nuestro error stander debe ser igual a la desviación estándar de la distribución original 9.3 en la raíz cuadrada adn en este caso es igual a 25 su raíz cuadrada de 55 por 525 así que eso es igual a 9.3 entre 5 y deben acercarse el valor al 1.87 vamos a ver con nuestra calculadora cuál es el resultado y que la sacamos de nuevo ahora tomo 9.3 entre 5 igual a 1.86 que es bastante cercano a 1.87 que tenemos acá esto es igual a 1.86 1.86 como pueden ver lo que obtuvimos de forma experimental es casi exactamente y esto es después de usar 10 mil muestras a lo que nos da el resultado teórico si hiciéramos otras 10 mil muestras bueno quizá no llegue al número exacto pero es bastante bastante cercano al que obtenemos con la fórmula así que la varianza de la distribución de muestreo de la media de la muestra va a ser igual a la varianza de la distribución original él no importa qué tan loca sea ésta dividida entre el número de las muestras el número de las muestras de las que se toma un promedio y en algunos momentos esto puede ser confuso ya que están tomando muestras de promedios de muestras así que se puede confundir si es el número de la muestra o el número de veces que estoy tomando el promedio de estas muestras por lo que nunca está de más hacer la aclaración normalmente cuando hablamos del tamaño de la muestra nos referimos a n al menos en mi mente cuando yo estoy pensando en pruebas si yo tomo bien igual a 16 y obtengo un promedio esa es una prueba y la gráfico lo hago nuevamente y hacemos otra prueba y así una y otra y otra vez pero espero que esto les haya aclarado el concepto y que ahora comprendan cómo obtener el error estándar de la media