Contenido principal
Tiempo actual: 0:00Duración total:9:10

Transcripción del video

digamos que tengo dos colecciones de datos distintos y en la primera colección tenemos los datos 224 y cuatro muy bien en nuestra primera lista de datos y en la segunda lista tenemos los siguientes vamos a ponerlo del lado derecho tenemos el 1 1 6 y 4 muy bien y lo primero que queremos ver es si hay un número que nos dé una medida de lo que podría ser el centro de los datos y ya hemos visto que una de esas formas es calculando la media muy bien entonces veamos para estos datos cuales la media para el lado izquierdo tenemos que la media se calcula como la suma de todos los datos dividido entre el número de datos verdad entonces tenemos dos más dos más cuatro +4 dividido entre cuatro muy bien y ahora sí intentamos calcular esto podemos ver que es dos más dos son cuatro más cuatro son ocho más cuatro son 12 / entre 4 y 12 / / 4 nos da exactamente 3 muy bien entonces ahora vamos a tratar de visualizar los datos vamos a ver si nosotros por ejemplo ponemos vamos a hacer lo digamos con una gráfica de puntos que digamos que ahí tenemos un eje tenemos nuestro eje y ponemos por ejemplo no sé aquí a lo mejor el 0 y el 1 para ponerlo bien el dos el tres y el cuatro y digamos que llegamos hasta el 5 entonces podríamos ir acomodando estos datos con puntos verdad como ya hemos visto en otros vídeos aquí tenemos dos tenemos otros dos y tenemos 24 es verdad entonces tenemos un 4 y un 4 muy bien y ahora observamos que la media estrés es decir se encuentra más o menos no más o menos si no se encuentra exactamente aquí la media verdad que la media lo podemos ver justamente como una especie de dependencia central verdad qué pasaría si ahora empezamos a analizar los datos del lado derecho no pensemos primero cuánto vale la media la media pues nuevamente será la suma de todos los datos que será uno más uno más 6 +4 dividido entre el número de datos que es cuatro entonces esto cuando nos daban no tenemos uno más uno son 2 massey son ocho más cuatro son 12 tenemos 12 entre cuatro que como vimos en el ejemplo anterior esto vale tres así que vamos a intentar visualizar esto nuevamente porque hay aquí hay algo interesante tenemos la misma media aunque tenemos distintos datos verdad son bastante distintos estos datos pero pero hay algo muy particular de estos datos con respecto a a los a los datos amarillos verdad y esto es lo que vamos a tratar de visualizar muy bien entonces pongamos nuevamente un eje digamos esta recta numérica y bueno nuestros datos llegan hasta el face así que digamos que esto es el 0 y el 1 el 2 y el 3 el 4 y el 5 y el 6 y digamos que llegamos hasta el 7 entonces tenemos dos veces el 1 que tenemos aquí el 12 veces y tenemos una vez el 6 tenemos una vez el 6 y tenemos una vez el 4 entonces lo que observamos hace unos hace unos momentos es que es la misma media verdad la media también se encuentra en el e3 muy bien aquí tenemos la media así que podríamos pensar que tenemos el mismo centro pero se ven muy distintos los datos verdad de hecho tiene que ver esto con la variabilidad que es uno de los conceptos importantes en estadística verdad aquí en este eje robert de los puntos parecen estar mucho más esparcidos en promedio verdad y esto es bastante interesante cuando estamos estudiando estadística no no sólo tenemos que calcular la media sino además podríamos buscar una medida de cómo es la variabilidad de los datos y para eso vamos a usar el siguiente concepto que se le conoce como la desviación media absoluta la desviación media absoluta muy bien absoluto está muy bien entonces que es la desviación media absoluta bueno esencialmente lo que nos dice es en promedio que tan lejos están los puntos de la media quería lo mejor este concepto sonará un poco un poco extravagante o quizás un poco raro pero en realidad es muy sencillo y vamos a verlo con estos mismos ejemplos muy bien entonces para el caso de la izquierda key si nosotros calculamos la desviación absoluta de los datos a la media en realidad tenemos que hacer por ejemplo en el primer caso tendríamos que hacer 2 - 3 aquí no se está midiendo la desviación pero si le ponemos el valor absoluto nos dice la desviación absoluta bien ahora qué pasa con el segundo caso con el segundo dato perdón sería 2 - 3 con valor absoluto tenemos el tercer dato que es 4 - 3 con valor absoluto más 4 - 3 verdad del último dato con valor absoluto entonces cada uno de éstos es una desviación absoluta del dato a o más bien la desviación del dato con respecto de la media ahora bien como nosotros queremos una desviación media absoluta tenemos que hacer el promedio de todas estas desviaciones que son 44 desviación es verdad entonces si nosotros ahora si calculamos esto bueno tenemos que 2 - 3 - 1 pero con valor absoluto es 1 2 - 3 - 1 con valor absoluto 14 - 3 1 y 4 - 31 ambos están dando mismo con el valor absoluto verdad entonces si sumamos estos 41 tenemos cuatro entre cuatro que es exactamente uno muy bien entonces lo que podríamos hacer visualmente es que el 2 dista del 3 verdad en 1 aquí tenemos sólo una unidad digamos un paso para llegar a la media lo mismo pasa con este dato y también pasa con el dato digamos cuando cuando cuando tenemos que el dato vale 4 ok en estos casos la desviación hacia la media es de 1 verdad eso es visualmente como lo podemos ver qué pasa con el ejemplo ver de cómo calculamos la desviación media absoluta que de hecho podríamos no sea lo mejor abreviarlo como de m&a verdad desviación media absoluta entonces vamos a calcular la de emea para el caso verde tenemos que la de m á pues sería en el primer caso tenemos 11 - tres la desviación del primer dato con respecto a la media el segundo dato también es uno entonces tenemos 1 - 3 el tercer dato es 6 verdad 6 - tres verdad tendríamos aquí la desviación y finalmente 4 - 3 y todo esto nuevamente hay que dividirlo entre cuatro muy bien aquí estamos haciendo el promedio de todas las desviaciones absolutas 1 - 3 - 2 pero con valor absoluto es 21 - 3 - 2 con valor absoluto 226 menos 33 así que no importa el valor absoluto y 4 - 31 nuevamente no importa el valor absoluto así que si nosotros hacemos esta suma tenemos dos más dos son cuatro más tres son siete más uno son 8 y 8 / / 4 nos da dos muy bien entonces en la desviación media absoluta es 2 y aquí nuevamente podemos ver visualmente como es que distan de la media digamos por ejemplo en en el primer caso que tenemos que vale 1 tenemos una distancia de la media de dos unidades lo mismo para este dato verdad mientras que cuando vale 4 tenemos una desviación de uno y cuando vale 6 tenemos una desviación de tres verdad es justamente lo que tenemos en este caso así que en resumen lo que podemos decir es que la desviación media absoluta para este caso es 2 verdad este es el promedio de las desviaciones absolutas mientras que la desviación media absoluta en el caso izquierdo es de 1 verdad así que esto tiene bastante sentido pues en promedio los datos que tenemos en la derecha se desvían de la media por dos unidades mientras que del lado izquierdo la desviación media absoluta es una verdad sí que podemos decir que los datos del lado derecho están más esparcidos que los de el lado izquierdo