Contenido principal
Tiempo actual: 0:00Duración total:15:08

Transcripción del video

en este vídeo quiero presentarles la idea de la covarianza entre dos variables aleatorias que está definido como el valor esperado de la distancia o el producto de las distancias de cada una de las variables aleatorias de su media o de su valor esperado ahora vamos a escribir esto vamos a poner la x en un color diferente así que el valor esperado de la variable aleatoria x - el valor esperado de esta variable x x y es la variable aleatoria jetta de color verde por la distancia de llegue hasta su valor esperado la población media day e si esto no tiene sentido para ustedes en este momento siempre podemos revisar y pensar acerca de lo que está ocurriendo acá ponemos algunos números aquí hacemos las matemáticas pero en la realidad esto quiere decir que tanto varían juntas tenemos una x y un aie por cada uno de los puntos de la información y tomamos toda la población cada equis y llegué van juntas mutuamente es sólo una coordenada que escribimos aquí vamos a ver un ejemplo digamos que esta xv a estar por encima de su media y lleva a estar por debajo de su media de esta población vamos a tomar una instancia de las variables aleatorias x y le tomamos una muestra del universo y encontramos que x es igual a uno que llegue es igual vamos a decir que es igual a tres y digamos que sabemos de antemano que el valor esperado de x 0 y el valor esperado de llegue va a ser igual a 4 bueno en esta situación que es lo que acaba de pasar no conocemos la covarianza total sólo tenemos una muestra aquí de estas variables aleatorias pero lo que acaba de pasar es tenemos un 1 menos no vamos a calcular todo el valor esperado pero vamos a tomar los valores de esta muestra y ver qué sucede cuando hacemos esto que está dentro del valor esperado tenemos 1 - 0 1 - 0 es igual a 1 x 3 - 4 que es menos 11 por menos uno va a ser igual a menos sólo esto que nos dice nos dice que al menos para esta muestra de nuestras variables aleatorias x y en qué x está por encima de su valor esperado cuando llegué estaba por debajo de su propio valor esperado si seguimos haciendo esto y qué ocurrirá lo mismo para toda la población entonces tendré sentido que tuviera una con variación negativa ya que cuando una sube la otra baja y cuando una baja la otra sube si ambas hubieran juntas tendrían una cobardía anza positivas lo mismo si ambas fueran hacia abajo al mismo tiempo sería una cobardía esa positiva y el grado en el que van juntas es lo que nos dice la magnitud de la covarianza en este vídeo quiero unir a esta fórmula que es la definición de la copa alianza con todo lo que hemos hecho con la dirección por mínimos cuadrados y este digamos que una matemática divertida para mostrar todas estas conexiones y podemos ver que la definición de covarianza realmente se vuelve útil y yo pienso que esto es debido en gran parte a lo que se muestran las regresiones y todas estas cosas ya las hemos visto antes sólo que diferente manera en este vídeo vamos a reescribir todo esto esta definición de covarianza boya reescribirlo de manera que esto va a ser lo mismo que el valor esperado que el valor esperado y ahora vamos a multiplicar estos binomios de aquí el valor esperado de nuestra variable aleatoria x multiplicada por nuestra variable aleatoria ye menos y voy a hacer la parte de x primero más x por el valor esperado belle negativo nos queda menos pongámoslos con los colores correspondientes - x por el valor esperado deie este bebé el valor esperado deie es negativo viene de este valor negativo de acá y tenemos menos el valor esperado de x por llegue menos el valor esperado de x por ye en verde y finalmente multiplicamos el valor esperado de x negativo por - el valor esperado the eye que nos da más el valor esperado de x por el valor esperado deie me tardé un poco pero creo que es importante mantener el código de colores para hacerlo más entendible por lo tanto esto es el valor esperado de todo esto está aquí el valor esperado de todo esto que está aquí adentro vamos a tratar de simplificar esto el valor esperado de un conjunto de variables aleatorias es la suma o resta de sus correspondientes valores esperados al aplicar esto en este caso todo esto va a ser igual a el valor esperado y recuerdan que en algunos contextos eso lo pueden ver cómo la media aritmética o en una distribución continua como la probabilidad de la suma ponderada o la probabilidad de la integral ponderada todo esto lo hemos visto anteriormente vamos a reescribir esto que va a ser igual al valor esperado de las variables aleatorias x ye x poch y seguimos manteniendo el código de colores después debemos - x por el valor esperado de llegue lo escribimos - el valor esperado de x por el valor esperado de elche x por el valor despejado de yeah vamos a conservar el call of baja ahora tenemos menos el valor esperado de esto el valor esperado de x aquí el chiquito lo escribimos el valor esperado de x porsche y aquí puede ser algo confuso con todos los valores esperados admirados entre sí pero una forma de verlo es que aquellas cosas que ya tenemos su valor esperado no nos podemos ver simplemente como unos números son números conocidos ya que el valor esperado de un valor esperado el domingo que el valor esperado vamos a escribir está aquí para tenerlo siempre en mente el valor esperado del valor esperado dx va a ser igual al valor esperado de x pueden ustedes ver esto como la media de la población de la variable por lo que esto va a ser algo conocido el valor esperado de esto pues va a ser el mismo por ejemplo si la media de la población o el valor esperado fuera 5 sería lo mismo que el valor esperado de cinco pues el valor esperado de 55 espero que esto haya aclarado un poco esos valores esperados anidados ya estamos por terminar lo primero que hicimos fue tomar el valor esperado de esto y después desarrollar esta multiplicación de binomios y finalmente estamos completando esa parte donde nos queda más el valor esperado de todo esto de acá el valor esperado de x por el valor esperado belle ahora veamos si podemos simplificar estoy acá este va a ser el valor esperado del producto de estas dos variables aleatorias y lo vamos a dejar así como está por el momento y las cosas que vamos a dejar así vamos a escribir las de nuevo acá el valor esperado de x por llegue y ahora que tenemos aquí tenemos el valor esperado de x por el valor esperado deie pero como lo mencionamos anteriormente éste va a ser un valor el valor esperado deie así que podemos sacarlos y eso fue el valor esperado de 3x sería lo mismo que tres por el valor esperado de x por lo que aquí ponemos - el valor esperado the yeah el valor esperado de che por el valor esperado de x valor esperado de x pueden verlo como que estamos factor izando o sacando este valor y ahora tenemos menos exactamente lo mismo acá podemos actualizar este valor esperado dx y sacarlo de esta parte de manera que nos queda - el valor esperado de x por el valor esperado deie el valor esperado ll trató a seguir el código de colores porque se está poniendo un poco confuso esto con todas las heces y finalmente fue bueno lo mismo tenemos el valor esperado de x por el valor esperado de yale y esto va a ser el producto de estos dos valores esperados más el valor esperado de x x el valor esperado the yeah y qué nos queda acá tenemos menos el valor esperado deie por el valor esperado de x - el valor esperado de x por el valor esperado deie y estas dos cosas son exactamente lo mismo estamos restando estos dos veces y tenemos una más todas estas tres son iguales aquí tenemos el valor esperado deie por el valor esperado de x aquí tenemos el valor esperado deie por el valor esperado de x o lo que diferente orden y aquí tenemos el valor esperado belle por el valor esperado de x igual en otro orden los restantes dos veces si lo sumamos una vez o también podemos verlo como que este elemento se cancela con este otro elemento lo que nos queda es que la covarianza de estas dos variables aleatorias es igual al valor esperado voy a regresar a los colores para que quede de nuevo más claro esto x por llegue el valor esperado del producto de xy llegue - qué nos queda el valor esperado de llegue lo ponemos en el verde que les corresponde - el valor esperado deie por el valor esperado de x por el valor esperado dx y podemos calcular estos valores esperados si es que conocemos la distribución de las probabilidades las funciones de densidad para cada una de estas variables aleatorias o si tenemos toda la población que estamos mostrando de donde estamos tomando instancias de estas dos variables digamos que tenemos una muestra de estas dos variables como podríamos estimar las siglas estamos estimando el valor esperado y digamos que tenemos muchos puntos de datos muchas coordenadas y veremos cómo esto se relaciona con la regresión y el valor esperado de x por llegue se puede aproximar col la media de la muestra del producto de xy llegue la media de la muestra de que sigue tomamos cada una de nuestras asociaciones x y le hacemos el producto y encontramos la media de todos ellos y estoy acá es el valor esperado de james que puede aproximarse por la media de la muestra que llegue y el valor esperado de x puede aproximarse por la media de la muestra de x por lo tanto a que se puede aproximar la covarianza de dos variables aleatorias esto de aquí es la media del producto la media del producto de las variables de las muestras - la media de las muestras de ye una media de las muestras de llegue por la media de las muestras de x y esto ya les debe parecer familiar porque qué es esto este es el numerador el numerador de cuando queremos calcular la pendiente de la línea de regresión cuando queremos calcular la pendiente de la línea de regresión vamos a reescribir la fórmula aquí para poderla recordar era literalmente la media del producto de las variables aleatorias o de nuestros puntos de los datos - la media de las leyes por las medias de las x todo esto dividido entre la media de x cuadrada o incluso pueden verlo como la media de la multiplicación de las x pero por conveniencia vamos a escribirlo x cuadrada menos la media de x elevado al cuadrado y esto es cómo calculamos la pendiente de nuestra línea de regresión una mejor manera de ver esto es asumir en nuestra línea de regresión que los puntos que tenemos son muestras de un universo entero de puntos posibles y podemos decir que nos estamos aproximando a la pendiente de la línea de regresión éste como son grito indica que es una aproximación y podrán encontrarlo en algunos libros de texto así nos estamos aproximando a la línea de regresión de la población a partir de una muestra de este ahora de todo lo que hemos hecho hasta el momento estoy acá es la covarianza o es un estimado de la covarianza de xy llegue y que se la estoy aquí abajo bueno podemos escribir esto muy fácilmente ese denominador lo podremos reescribir como la media de x x x que lo mismo que x cuadrada menos la media de x por la media de x y eso es lo que significa esta medida bx al cuadrado bueno ustedes lo pueden ver cómo la covarianza dx coma x ándele esa está muy buena esto ya lo hemos visto anteriormente esto lo vimos hace ya bastantes videos cuando aprendimos por primera vez que era esto la covarianza de una variable aleatoria consigo mismas por lo que esto es la varianza de la variable la historia x y eso lo pueden verificar ustedes mismos si cambian estalle por una x esto se convierte en x - el valor esperado de x x x - el valor esperado de x o x - el valor esperado de x al cuadrado lo que es la definición de varianza por lo que otra manera de ver la pendiente de nuestra línea de regresión puede verse literalmente como la covarianza de nuestras dos variables aleatorias dividido entre la varianza de equis entre la varianza de x o lo que es lo mismo la variable aleatoria independiente esto es la pendiente de nuestra línea de regresión y creo que esto es bastante interesante ver cómo cosas que vemos en diferentes partes de la estadística en realidad están conectadas