Contenido principal
Tiempo actual: 0:00Duración total:9:49

Transcripción del video

en este vídeo quiero hablar acerca de algo que probablemente sea uno de los conceptos fundamentales y profundos de la estadística y quizás de todas las matemáticas y este es el teorema del límite central problema del límite central y lo que nos dice es que podemos empezar con cualquier distribución que tenga una media y varianza bien definidas digamos si tiene una variante za no se puede hacer una distribución continua o discreta voy a dibujar una discreta porque es más fácil de imagina al menos para los propósitos de este vídeo entonces digamos que tengo una función de distribución de probabilidad discreta y quiero hacer cuidadoso de que esto no se ha aparecido una distribución normal para que vean el poder del teorema digamos que tengo una distribución que toma valores 1 2 3 4 5 y 6 digamos de algún grado medio loco y digamos que es muy probable que obtengamos el 1 vamos a obtener uno muy probable dos pues más dos no perdón 3 y 4 pues más o menos y el 6 también es muy probable de obtenerlo entonces esa es mi función de distribución de probabilidad digamos que si fuese a dibujar la media más o menos esto es simétrico entonces la media se estaría la mitad con cierta desviación estándar no sé no sé como sea pero bueno esta es mi disco mi función de distribución de probabilidad discreta ahora lo que voy a hacer es en vez de tomar muestras de esta variable aleatoria que está escrita por esta función de distribución voy a tomar muestras de ella pero voy a tomar el promedio de esas muestras y luego voy a mirar y ver la frecuencia de los promedios que obtengo y cuando digo promedio déjenme definir lo siguiente entonces digamos que el tamaño de la muestra es n estã n igual a 4 ok lo que significa es que voy a tomar cuatro muestras de esto digamos que la primera vez tomó cuatro muestras digamos que obtengo 11 luego un 3 y luego un 6 entonces esta es nuestra primera muestra de tema 4 sé que la terminología puede ser un poquito complicada pero esto nos está diciendo que tenemos una muestra de cuatro muestras es decir la muestra es una muestra de cuatro elementos que tomamos de nuestra distribución es decir se refiere al conjunto de muestras de la distribución y el tamaño nos dice cuánto realmente tomaste de esta distribución la terminología puede ser confusa porque puedes fácilmente ver uno de éstos como una muestra que estamos tomando cuatro de ellos es decir tenemos una muestra de 4 y lo que voy a hacer es tomar el promedio vamos a tomar el promedio sale y cuál es el promedio de esta primera muestra así que tengo uno más uno es dos más tres son 5 y 6 son 11 y 11 / / 4 es de 2.75 esta es mi primera media muestral de tamaño cuatro muy bien déjenme hacer otra digamos que mi segunda muestra digamos que obtuvo un 3 un no sea un 4 otro 3 tal vez y uno no se sólo se me ocurrió quizás no salió el 6 ya cuenta que el 2 y el 5 no pueden aparecer sale entonces la probabilidad de obtener 2 y 5 o 5 más bien es cero entonces para esta segunda muestra de tamaño 4 nuestra media muestral a la media muestra al ser ya tres más 47 más tres son diez más uno es 11 y otra vez entre cuatro nos da 2.75 dejen hacer una más porque realmente quiero que se vea de qué estamos hablando entonces digamos que tengo una muestra otra vez de tamaño 4 digamos que tengo voy a tomar se dan cuenta esta muestra está hecha de muestras verdad pero bueno digamos que es en esta última muestra octubre 1 1 6 y 6 entonces me media muestra al va a ser uno más uno que es 2 massey son 8 massey son 14 y 14 entre 4 es a 33.5 verdad 10.51 mientras estoy encontrando estas medias muestrales para cada una de mis muestras de tamaño 4 halló la media y vamos a ir a grassi carlas en una distribución de frecuencias y esto va a sorprenderte en algunos segundos más adelante entonces gráfico todo esto en una distribución de frecuencias digamos que en mi primera muestra la media muestra fue de 2.75 entonces gráfico la frecuencia de estos números es decir obtuve hasta ahorita una vez 2.75 luego la siguiente vez octubre también 2.75 ahí está así que lo tuve dos veces entonces obtengo ahora el gráfico la una vez que obtuve 3.5 digamos que anda de este lado entonces obtuve una vez lo graficó aquí lo que voy a hacer es seguir tomando todas estas muestras tal vez diez mil y entonces seguiré tomando estas muestras digamos dijimos que hasta la muestra 10.000 y vamos a ver cómo a través del tiempo ok voy a tener que poner puntos mejor si lo miro así digamos a lo largo de las muestras los valores que pueden tener los voy graficando con sus frecuencias entonces el primer punto éste estará aquí mismo digamos éste que había puesto el rojito luego el segundo punto lo colocó a y digamos sacan del 3.5 en fin voy a tener diez mil veces desde entonces y lo sigo graficando simplemente vas a a continuar graficando las frecuencias una y otra vez y lo que veremos es que a medida que tomó muchas muestras de tamaño 4 voy a tener algo que se vaya a aproximar a una distribución normal entonces cada uno de estos puntos representa una incidencia de una media muestral y a medida que sigue agregando yo en esta columna y vamos a que obtuve varias de 2.75 y voy avanzando a lo largo de las muestras y se aproxima una distribución normal y este es un resultado muy buena onda acerca del teorema de límites del límite central entonces el teorema nos dice que esta distribución naranja para en igual a 4 que el tamaño de la muestra si hago la misma cosa conjunta con una muestra digamos de tamaño 20 entonces tengo una distribución medio loca y original inicialmente pero los datos de mi variable aleatoria si voy graficando la la media muestra en una gráfica de frecuencias se verá lo mejor así no vamos a discutir en unos vídeos más adelante pero resulta que si fuera a graficar 10 mil de estas muestras ahora voy a tener algo así que se apruebe se aproxima también a una distribución normal vamos a ver qué en videos más adelante que tenemos este tenemos la misma media vamos a tener la misma media pero va a tener una desviación estándar menor de hecho debería graficar un poquito distinto esto porque se va pelando verdad de fondo entonces se va aproximando cada vez más aún a distribuir distribución normal y la realidad es que es un resultado genial acerca este es el problema del límite central que a medida que la muestra el tamaño de la muestra se vuelve más grande digamos tiende a infinito digo realmente no es infinito sino que se hacen cada vez más grande de hecho no es tan grande lo que se necesita graves con diez o veinte ya es suficiente pero lo que es muy muy increíble es que esta distribución lo que original no tienen nada que ver con una distribución normal pero si tenemos una muestra digamos un tamaño mes muestral de en igual a 10 tomamos cien de éstos en vez de cuatro gráfica más la frecuencia de las medias muestrales y luego tomamos otros cien y es si así lo hiciéramos una una cantidad de veces muy grande digamos dependiera infinito también encontraríamos una distribución normal perfecto es la parte local el asunto y no solamente aplica tomando la medida muestra también si pudimos haber tomado sólo la suma muestra y el teorema del límite central seguiría aplicando pues esto es lo útil de esto porque en la vida hay muchos tipos de procesos proteína chocando contra otras personas haciendo cosas locas humanos interactuando de extrañas maneras gente abriendo facebook y no sabes la función o de distribución de estas cosas o el teorema del límite central nos dice que si tomamos muchas de estas acciones si las juntamos y asumimos que todas tienen la misma distribución entonces la frecuencia de las medias muestra les vamos a obtener de ahí una distribución normal y esto es lo que hace francamente lo que hace que la distribución normal sea tan útil en estadística y francamente es una muy buena aproximación de la suma de las medias de muchos procesos es una distribución normal y lo que te voy a mostrar en los siguientes vídeos es que mientras incrementa su tamaño de la muestra mientras duerme tomes muchas muchas y muchas cada vez más esta gráfica de frecuencias se parecerá cada vez más a una distribución normal