Si estás viendo este mensaje, significa que estamos teniendo problemas para cargar materiales externos en nuestro sitio.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Contenido principal

Aproximación cuadrática

Las aproximaciones cuadráticas extienden la noción de una linealización local, dando una aproximación aún más cercana de una función.

Qué vamos a construir

El objetivo, como en la linealización local, es aproximar una función mutivariable potencialmente complicada f, cerca de algún vector de entrada x0. Una aproximación cuadrática hace esto de manera más cercana que una linealización local con la información dada por las derivadas parciales de segundo orden.
Forma no vectorial
En el caso específico en que la entrada de f es bidimensional, la aproximación cuadrática cerca de un punto (x0,y0) se ve así:
Qf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
Forma vectorial:
La forma general de esto, para una función escalar f con cualquier tipo de entrada multidimensional, tiene una aproximación que se ve así:
Qf(x)=f(x0)Constante+f(x0)(xx0)Término lineal+12(xx0)THf(x0)(xx0)Término cuadrático
Sabemos que esto parece un poco complicado, pero más adelante iremos paso a paso para ver cómo llegar a esta expresión. He aquí un breve resumen de cada término.
  • f es una función con una entrada multidimensional y una salida escalar.
  • f(x0) es el gradiente de f evaluado en x0.
  • Hf(x0) es la matriz hessiana de f evaluada en x0.
  • El vector x0 es una entrada específica, cerca de la cual vamos a aproximar.
  • El vector x representa la variable de entrada.
  • La función de aproximación Qf tiene el mismo valor que f en el punto x0, todas sus derivadas parciales tienen el mismo valor que las de f en este punto, y todas sus derivadas parciales de segundo orden tienen el mismo valor que las de f en ese punto.

Aproximaciones más y más precisas

Imagina que tienes alguna función f(x,y) con dos entradas y una salida, por ejemplo
f(x,y)=sin(x)cos(y)
Contenedor video de Khan Academy
El objetivo es encontrar una función más sencilla que aproxime a f(x,y) cerca de un punto particular (x0,y0). Por ejemplo,
(x0,y0)=(π3,π6)

Aproximación de orden cero

La aproximación más ingenua sería una función constante que es igual al valor de f en (x0,y0) en todas partes. A esta la llamamos "aproximación de orden 0".
En el ejemplo:
C(x,y)=sin(π3)cos(π6)=(32)32=34
Escrito en abstracto:
C(x,y)=f(x0,y0)Función constante
De manera gráfica:
La gráfica de esta función de aproximación C(x,y) es un plano que pasa por la gráfica de la función en el punto (x0,y0,f(x0,y0)). El siguiente video muestra cómo esta aproximación cambia conforme movemos el punto (x0,y0).
Contenedor video de Khan Academy
La gráfica de f se muestra en azul; la gráfica de la aproximación, en blanco, y el punto (x0,y0,f(x0,y0)), en rojo.

Aproximación de primer orden

La aproximación de orden cero, una función constante, es bastante mala. Claro, te garantiza que sea igual a f(x,y) en el punto (x0,y0), pero no más. El siguiente paso es usar una linealización local, también conocida como "aproximación de primer orden".
En el ejemplo:
Lf(x,y)=34+34(xπ3)+34(yπ6)
Escrito en abstracto:
Lf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)
Aquí, fx y fy denotan las derivadas parciales de f.
De manera gráfica:
La gráfica de la linealización local es el plano tangente a la gráfica de f en el punto (x0,y0,f(x0,y0)). En el siguiente video muestra cómo esta aproximación cambia conforme nos movemos alrededor del punto (x0,y0):
Contenedor video de Khan Academy

Aproximación de segundo orden.

Una aproximación cuadrática es aún mejor, se conoce también como "aproximación de segundo orden".
El resto de este artículo está dedicado a encontrar y entender la forma analítica de tal aproximación, pero antes de entrar de lleno, vamos a ver cómo se ve esta aproximación de manera gráfica. Puedes pensar en estas aproximaciones como rodear con curvas la gráfica en el punto (x0,y0,f(x0,y0)), dándole una especie de abrazo matemático.
Contenedor video de Khan Academy

"Cuadrático" se refiere al producto de dos variables

En funciones de una variable, la palabra "cuadrático" se refiere a cualquier situación en donde una variable esté elevada al cuadrado, como en el término x2. Con muchas variables, "cuadrático" se refiere no solo a términos cuadrados, como x2 y y2, sino también a términos que involucran el producto de dos variables separadas, como xy.
En general, el "orden" de un término que sea el producto de varias cosas, como 3x2y3, es el número total de variables que aparecen multiplicadas en ese término. En este caso, el orden es 5: dos x's, tres y's, y la constante no importa.

Gráficas de funciones cuadráticas

Una manera de pensar en una función cuadrática es en términos de su concavidad, que puede depender de la dirección en la que te mueves.
Si la función es cóncava hacia arriba, como es el caso, por ejemplo, de la función f(x,y)=x2+y2, la gráfica se verá más o menos así:
Esta figura, que es una parábola tridimensional, se llama paraboloide.
Si la función es cóncava hacia arriba en una dirección y lineal en otra, la gráfica se ve como una curva parabólica que ha sido arrastrada a lo largo del espacio para trazar una superficie. Por ejemplo, esto pasa en el caso de f(x,y)=x2+y:
Por último, si la gráfica es cóncava hacia arriba cuando nos movemos en una dirección, pero cóncava hacia abajo cuando nos movemos en otra, como en el caso de f(x,y)=x2y2, la gráfica se ve como una silla de montar. Aquí está como se ve una gráfica así:
Contenedor video de Khan Academy

Recordatorio sobre la receta de linealización local

Para escribir la aproximación cuadrática de una función f cerca del punto (x0,y0), comenzamos con la linealización local:
Lf(x,y)=f(x0,y0)Término constante+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)Términos lineales
Vale la pena recorrer paso a paso la receta para encontrar la linealización local una vez más ya que la receta para encontrar una aproximación cuadrática es muy parecida.
  • Empezamos con el término constante f(x0,y0), de tal manera que la aproximación al menos sea igual a f en el punto (x0,y0).
  • Sumamos los términos lineales fx(x0,y0)(xx0) y fy(x0,y0)(yy0).
  • Usamos las constantes fx(x0,y0) y fy(x0,y0) para asegurarnos de que nuestra aproximación tenga las mismas derivadas parciales que f en el punto (x0,y0).
  • Usamos los términos (xx0) y (yy0) en lugar de solamente x y y, de modo que no arruinemos el hecho de que nuestra aproximación sea igual a f(x0,y0) en el punto (x0,y0).

Encontrar la aproximación cuadrática

Para la aproximación cuadrática, sumamos los términos cuadráticos(xx0)2, (xx0)(yy0) y (yy0)2, y por ahora escribimos sus coeficientes como las constantes a, b y c, cuyos valores encontraremos en un momento:
Qf(x,y)=f(x0,y0)Parte de orden 0+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)Parte de orden 1+a(xx0)2+b(xx0)(yy0)+c(yy0)2Parte cuadrática
De la misma manera en la que nos aseguramos de que la linealización local tenga las mismas derivadas parciales que f en (x0,y0), queremos que la aproximación cuadrática tenga las mismas derivadas parciales de segundo orden que f en este punto.
Lo realmente agradable acerca de la forma en que escribimos Qf arriba, es que la segunda derivada parcial 2Qfx2 solo depende del término a(xx0)2.
  • ¡Inténtalo! Toma la segunda derivada parcial con respecto a x en cada término en la expresión de Qf(x,y) arriba, y date cuenta que todas se hacen cero excepto el término a(xx0)2.
¿De verdad lo intentaste?En serio; toma un momento y hazlo. Ayuda mucho a entender por qué expresamos Qf de la manera en que lo hicimos.
Este hecho es lindo porque en lugar de tomar la segunda derivada parcial de toda la expresión monstruosa, puedes verla así:
2Qfx2(x,y)=(Un montón de 0’s)+2x2a(xx0)2+(más 0’s)=x2a(xx0)=2a
Como el objetivo es hacer que esto coincida con fxx(x,y) en el punto (x0,y0), puedes despejar a así:
a=12fxx(x0,y0)
Ponte a prueba: usa un razonamiento similar para averiguar cuánto deben valer las constantes b y c.
Ahora podemos escribir nuestra aproximación cuadrática en su forma final, con cada uno de sus seis términos trabajando en armonía para reproducir el comportamiento de f en (x0,y0):
Qf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2

Ejemplo: aproximar la función sin(x)cos(y)

Para ver a esta bestia en acción, vamos a probarla en la función de la introdución.
Problema: encuentra la aproximación cuadrática de
f(x,y)=sin(x)cos(y)
alrededor del punto (x,y)=(π3,π6).
Solución:
Para recopilar toda la información necesaria, necesitas evaluar f(x,y)=sin(x)cos(y) y todas sus derivadas parciales de primer y segundo orden en el punto (π3,π6).
f(π3,π6)=

fx(x,y)=
fx(π3,π6)=

fy(x,y)=
fy(π3,π6)=

fxx(x,y)=
fxx(π3,π6)=

fxy(x,y)=
fxy(π3,π6)=

fyy(x,y)=
fyy(π3,π6)=

¡Ya casi! Como último paso, usa todas estos valores en la fórmula para una aproximación cuadrática.
Así que por ejemplo, esta es la fórmula que escribí en el programa para graficar para generar la animación de las aproximaciones cuadráticas.
Contenedor video de Khan Academy

Notación vectorial mediante la matriz hessiana

Tal vez no sea necesario decir que la expresión para la aproximación cuadrática es larga. Ahora imagina que f tuviera tres entradas, x, y y z. En principio puedes imaginar cómo podría ser esto: sumar los términos que involucran a fz, fxz, fzz, y así sucesivamente con las 3 derivadas parciales de primer orden y las 9 de segundo orden. ¡Pero esto sería una pesadilla!
Ahora imagínate que estuvieras escribiendo un programa para encontrar la aproximación cuadrática para una función con 100 entradas. ¡Una locura!
De hecho no tiene por qué ser tan malo. Cuando algo no es complicado en principio, no debe ser complicado en notación. Las aproximaciones cuadráticas son un poco complicadas, cierto, pero no son absurdas.
Al usar vectores y matrices, específicamente el gradiente y la matriz hessiana de f, podemos escribir la aproximación cuadrática Qf de la siguiente manera:
Qf(x)=f(x0)Constante+f(x0)(xx0)Término lineal+12(xx0)THf(x0)(xx0)Término cuadrático
Desglosemos la expresión:
  • La x en negritas representa la(s) variable(s) de entrada como un vector,
    x=[xy]
    Por otra parte, x0 es un vector particular en el espacio de entrada. Si esto tiene dos componentes, esta fórmula para Qf solo es una forma diferente de escribir la que derivamos anteriormente, pero también podría representar un vector con cualquier otra dimensión.
  • El producto punto f(x0)(xx0) se expandirá dentro de la suma como los términos fx(x0)(xx0), fy(x0)(yy0), etcétera. Si esto no te resulta familiar de la notación vectorial para la linealización local, ¡hazlo tú mismo para el caso en 2 dimensiones!
  • El superíndice T en la expresión (xx0)T indica "transponer". Esto significa que tomas el vector inicial (xx0), que se ve así:
    (xx0)=[xx0yy0]
    Después lo volteas para obtener algo como esto:
    (xx0)T=[xx0yy0]
  • Hf(x0) es la matriz hessiana de f.
  • La expresión (xx0)THf(x0)(xx0) puede parecer complicada si nunca te has encontrado con ella anteriormente. Esta forma de expresar términos cuadráticos es en realidad una forma bastante común tanto en cálculo como en álgebra vectorial, así que vale la pena expandir una expresión como esta por lo menos unas cuantas veces en tu vida. Por ejemplo, trata de desarrollarla en el caso en que x es bidimensional para ver cómo se ve.
    Debes encontrar que es exactamente 2 veces la parte cuadrática de la fórmula en forma escalar que calculamos antes.

¿Cuál es el objetivo?

La verdad es un muy tedioso calcular a mano una aproximación cuadrática y tenemos que ser muy organizados para poder hacerlo sin equivocarnos. En la práctica, la gente rara vez calcula una aproximación cuadrática como lo hicimos arriba, pero saber cómo funcionan es muy útil por al menos dos grandes razones:
  • Cálculos: incluso si nunca tienes que escribir una aproximación cuadrática, quizá algún día tengas que programar una computadora para que lo haga para alguna función en particular. O incluso si dependes del programa de alguien más, puede ser que tengas que analizar cómo y por qué la aproximación falla bajo alguna circunstancia.
  • Teoría: ser capaces de hacer referencia a una aproximación de segundo orden nos ayuda a razonar sobre el comportamiento general de las funciones cerca de algún punto. Esto nos será de utilidad para determinar si ese punto es un máximo o un mínimo local.

¿Quieres unirte a la conversación?

Sin publicaciones aún.
¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.