Si estás viendo este mensaje, significa que estamos teniendo problemas para cargar materiales externos en nuestro sitio.

If you're behind a web filter, please make sure that the domains *.kastatic.org and *.kasandbox.org are unblocked.

Contenido principal

Razonamiento detrás del criterio de la segunda derivada

Para aquellos de ustedes que quieran ver por qué funciona la segunda derivada parcial, aquí está un bosquejo de una demostración.  

Antecedentes

En el último artículo, dimos las bases para el criterio de la segunda derivada parcial, pero fue solo una idea intuitiva vaga de por qué es cierta. Este artículo es para aquellos que quieran indagar un poco más en las matemáticas, pero no es estrictamente necesario si solo quieres saber aplicar ese criterio.

Qué vamos a construir

  • Para probar si un punto crítico de una función multivariable es un mínimo o máximo local, examina la aproximación cuadrática de la función en ese punto. Es más fácil analizar si esta aproximación cuadrática tiene máximos y mínimos.
  • Para funciones de dos variables, esto se reduce al estudio de una expresión que tiene este aspecto:
ax2+2bxy+cy2
Estas se conocen como formas cuadráticas. La regla para saber cuándo una forma cuadrática es siempre positiva o siempre negativa se traduce directamente al criterio de la segunda derivada parcial.

Caso de una variable mediante aproximación cuadrática

En primer lugar, seguiremos el razonamiento formal de por qué funciona el criterio de la segunda derivada para una sola variable. Por formal, nos referimos a captar la idea de concavidad con un argumento preciso.
En el cálculo de una sola variable, cuando f(a)=0 para alguna función f y algún valor de entrada a, el criterio de la segunda derivada nos dice que:
  • f tiene un máximo local en a si f(a)<0.
  • f tiene un mínimo local en a si f(a)>0.
  • Si f(a)=0, la segunda derivada no es suficiente para determinar si f tiene un máximo, un mínimo o un punto de inflexión en a.
Para pensar por qué funciona esta prueba, empieza por aproximar la función con un polinomio de Taylor hasta el término cuadrático, que también se conoce como una aproximación cuadrática.
f(x)f(a)+f(a)(xa)+12f(a)(xa)2
Puesto que f(a)=0, esta aproximación cuadrática se simplifica así:
f(a)+12f(a)(xa)2
La aproximación cuadrática en un mínimo local.
Observa que (xa)20 para todos los valores posibles de x, pues los términos cuadráticos siempre son cero o positivos. ¡Ese simple hecho nos dice todo lo que necesitamos saber! ¿Por qué?
Porque cuando f(a)>0, podemos leer nuestra aproximación así:
f(a)+12f(a)(xa)2Esto es 0 para toda x,y es igual a 0 solo cuando x=a.
Por lo tanto, a es un mínimo local de nuestra aproximación. De hecho es un mínimo global, pero eso no nos importa. Cuando la aproximación cuadrática de una función tiene un mínimo local en algún punto, la función misma debe tener un mínimo local en ese lugar. Hablaremos más sobre esto en la última sección; pero por ahora la intuición debe ser clara, pues la función y su aproximación se "abrazan" la una a la otra alrededor del punto de aproximación a.
La aproximación cuadrática en un máximo local.
Similarmente, si f(a)<0, podemos leer la aproximación como
f(a)+12f(a)(xa)2Esto es 0 para todos los valores de x,e igual a 0 solo cuando x=a
En este caso, la aproximación tiene un máximo local en x=a, lo que indica que la función misma también tiene un máximo local ahí.
La aproximación cuadrática en el punto de inflexión es horizontal.
Cuando f(a)=0, nuestra aproximación cuadrática siempre es igual a la constante f(a), lo que significa que nuestra función es en algún sentido demasiado plana para ser analizada solamente con la segunda derivada.
Qué se obtiene de todo esto:
Cuando f(a)=0, determinar si f tiene un máximo o un mínimo local en a se reduce a estudiar si el signo del término cuadrático de la aproximación de Taylor, 12f(a)(xa)2, es positivo o negativo.

Caso de dos variables: calentamiento visual

Ahora considera una función f(x,y) con dos entradas y una salida, que tiene un punto crítico. Esto es, un punto donde ambas derivadas parciales son 0,
fx(x0,y0)=0fy(x0,y0)=0
que de manera compacta se escribe como
f(x0,y0)=0Vector cero
f(x0,y0)=0 quiere decir que el plano tangente en (x0,y0) es horizontal.
Para determinar si este punto es un máximo local, un mínimo local o ninguno de los dos, examinamos su aproximación cuadrática. Empecemos con una vista previa de lo que queremos hacer:
  • f tendrá un mínimo local en el punto crítico (x0,y0) si la aproximación cuadrática en el punto es un paraboloide cóncavo hacia arriba.
  • f tendrá un máximo local allí si la aproximación cuadrática es un paraboloide cóncavo hacia abajo:
  • Si la aproximación cuadrática tiene forma de silla, f no tiene ni un máximo ni un mínimo, sino un punto silla.
  • Si la aproximación cuadrática es horizontal en alguna o todas las direcciones, no tenemos suficiente información para sacar conclusiones sobre f.

Análisis de la aproximación cuadrática

La fórmula para la aproximación caudrática de f, en forma de vector, se ve así:
Qf(x)=f(x0)Constante+f(x0)(xx0)Término lineal+12(xx0)THf(x0)(xx0)Término cuadrático
Ya que nos interesan los puntos donde el gradiente es cero, podemos deshacernos de ese término del gradiente
Qf(x)=f(x0)+12(xx0)THf(x0)(xx0)
Para ver los detalles del caso de dos variables, expandamos el término hessiano,
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
(Nota: si sientes que esta aproximación o algo de la notación es extraña o poco familiar, considera revisar el artículo sobre aproximaciones cuadráticas).
Como mostramos en el caso de una sola variable, la estrategia es estudiar si el término cuadrático de esta aproximación es siempre positivo o siempre negativo.
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2}¿Es siempre 0?¿Es siempre 0?¿Puede ser uno de los dos?
Por lo pronto, escribir este término es tedioso, pero podemos destilar su esencia si estudiamos expresiones de la siguiente forma:
ax2+2bxy+cy2
Tales expresiones se llaman usualmente "formas cuadráticas".
  • La palabra "cuadrática" indica que los términos son de segundo orden, o sea que involucran el producto de dos variables.
  • La palabra "forma" en este contexto es desconcertante, y hace que la idea de una forma cuadrática suene más complicada de lo que realmente es. Los matemáticos dicen "forma cuadrática" en vez de "expresión cuadrática" para enfatizar que todos los términos son de orden 2, y que no hay términos lineales o constantes enredando la expresión. Adoptar una frase como "expresión puramente cuadrática" habría sido mucho más razonable y comprensible.
Para hacer la notación de las formas cuadráticas más fácil de generalizar a dimensiones más altas, a menudo las escribimos con respecto a la matriz simétrica M
xMx=[xy][abbc][xy]
He aquí la pregunta crucial:
  • ¿Cómo podemos determinar si la expresión ax2+2bxy+cy2 es siempre positiva, siempre negativa o ninguna de las dos, con solo estudiar las constantes a, b y c?

Análisis de las formas cuadráticas

Si sustituimos un valor constante y0 para y, obtenemos la función cuadrática de una sola variable:
ax2+2bxy0+c(y0)2
La gráfica de esta función es una parábola, y solo cruzará el eje x si esta función cuadrática tiene raíces reales.
Una función cuadrática con dos raíces reales que pueden ser ambas positivas o ambas negativas.
De lo contrario, la función es siempre positiva o siempre negativa, dependiendo del signo de a.
Una función cuadrática sin raíces reales puede ser siempre positiva o siempre negativa.
Podemos aplicar la fórmula cuadrática a esta expresión para ver si sus raíces son reales o complejas.
ax2+2bxy0+c(y0)2
  • El término principal es a.
  • El término lineal es 2by0.
  • El término constante es cy02
Aplicar la fórmula cuadrática se ve así:
2by0±(2by0)24acy022a2by0±2y0b2ac2ay0(b±b2aca)
Si y0=0, la parábola tiene una raíz doble en x=0, lo que significa que apenas toca al eje x en ese punto. En otro caso, el que las raíces sean reales depende solamente del signo de la expresión b2ac.
  • Si b2ac0, existen dos raíces reales, y la gráfica de ax2+2bxy0+c(y0)2 cruza el eje x.
  • En caso contrario, si b2ac<0, no existen raíces reales, y la gráfica de ax2+2bxy0+c(y0)2 es totalmente positiva o totalmente negativa.
Por ejemplo, considera el caso
  • a=1
  • b=3
  • c=5
En este caso, b2ac=32(1)(5)=4>0, así que la gráfica de f(x)=x2+6xy0+5y02 siempre cruza al eje x. He aquí un video que muestra cómo cambia la gráfica conforme dejamos que el valor de y0 varíe lentamente.
Contenedor video de Khan Academy
Esto corresponde con el hecho de que la gráfica de f(x,y)=x2+6xy+5y2 puede ser tanto positiva como negativa.
Contenedor video de Khan Academy
En contraste, considera el caso
  • a=2
  • b=2
  • c=3
Ahora b2ac=22(2)(3)=2<0. Esto significa que la gráfica de f(x)=2x2+4xy0+3y02 nunca cruza el eje x, aunque lo toca si la constante y0 es cero. Aquí mostramos un video donde se ve cómo cambia la gráfica conforme dejamos que la constante y0 varíe:
Contenedor video de Khan Academy
Esto corresponde con el hecho que la función multivariable f(x,y)=2x2+4xy+3y2 siempre es positiva.
Contenedor video de Khan Academy

Regla para el signo de las formas cuadráticas

Como si se tratara de confundir a los estudiantes familiarizados con la fórmula cuadrática, las propiedades de las formas cuadráticas a menudo se establecen en términos de acb2 en lugar de b2ac. Ya que una expresión es el negativo de la otra, tenemos que cambiar de 0 a 0. La razón por la que los matemáticos prefieren acb2 es porque este es el determinante de a matriz que describe la forma cuadrática:
det([abbc])=acb2
Como recordatorio, así es como se ve la forma cuadrática utilizando la matriz.
ax2+2bxy+cy2=[xy][abbc][xy]
Al vincular esta convención con lo que encontramos en la sección anterior, escribimos la regla del signo de una forma cuadrática de la siguiente manera:
  • Si acb2<0, la forma cuadrática puede alcanzar valores positivos y negativos, y es posible que sea cero en otros valores diferentes de (x,y)=(0,0).
  • Si acb2>0, la forma es siempre positiva o siempre negativa, dependiendo del signo de a, pero en ambos casos solo es igual a 0 en (x,y)=(0,0).
    • Si a>0, la forma siempre es positiva, por lo que (0,0) es un mínimo global de esta.
    • Si a<0, la forma siempre es negativa, por lo que (0,0) es su máximo global.
  • Si acb2=0, la forma será de nuevo o siempre positiva o siempre negativa, pero ahora es imposible que sea igual a 0 en valores distintos de (x,y)=(0,0).

Un poco de terminología:

Cuando ax2+2bxy+cy2>0 para todo (x,y) distinto de (x,y)=(0,0), decimos que la forma cuadrática y su matriz asociada son positivas definidas.
Cuando ax2+2bxy+cy2<0 para todo (x,y) distinto de (x,y)=(0,0), decimos que la forma cuadrática y su matriz asociada son negativas definidas.
Si reemplazas los signos > y < por y , respectivamente, las propiedades correspondientes son positiva semi-definida y negativa semi-definida.

Aplicación a Qf

Bueno, regresando a donde comenzamos, vamos a escribir otra vez nuestra aproximación cuadrática:
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
La parte cuadrática de Qf está escrita en términos de (xx0) y (yy0) en lugar de simplemente x y y, por lo que donde la regla del signo para la forma cuadrática hace referencia al punto (0,0), la aplicamos al punto (x0,y0).
Tal como en el caso de una sola variable, cuando la aproximación cuadrática Qf tiene un máximo (o un mínimo) local en (x0,y0), significa que f tiene un máximo (o un mínimo) local en ese punto. Esto quiere decir que podemos trasladar la regla del signo de una forma cuadrática directamente para obtener el criterio de la segunda derivada:
Supongamos que f(x0,y0)=0.
  • Si fxx(x0,y0)fyy(x0,y0)(fxy(x0,y0))2<0, entonces f no tiene ni un mínimo ni un máximo en (x0,y0), sino un punto silla.
  • Si fxx(x0,y0)fyy(x0,y0)(fxy(x0,y0))2>0, la función f definitivamente tiene un máximo o un mínimo en (x0,y0), y debemos determinar el signo de fxx(x0,y0) para saber cuál de los dos es.
    • Si fxx(x0,y0)>0, la función f tiene un mínimo local.
    • Si fxx(x0,y0)<0, la función f tiene un máximo local.
  • Si fxx(x0,y0)fyy(x0,y0)(fxy(x0,y0))2=0, las segundas derivadas por sí solas no nos pueden decir si f tiene un máximo o mínimo local.

Nuestras herramientas actuales no son suficientes

Todo lo que presentamos aquí casi constituye una prueba completa, excepto por un paso final.
Intuitivamente, puede tener sentido que cuando una aproximación cuadrática se dobla y curva de cierta manera, la función debe doblarse y curvarse de la misma manera cerca del punto de aproximación. Pero ¿cómo formalizamos esto más allá de la intuición?
Desafortunadamente no lo haremos aquí. Para hacer rigurosos los argumentos sobre derivadas, requerimos del análisis real, columna vertebral teórica del cálculo.
Más aún, puedes estarte preguntando cómo esto se generaliza a funciones con más de dos entradas. Hay una notación para las formas cuadráticas con múltiples variables, pero enunciar la regla para cuándo tales formas son siempre positivas o negativas requiere varias ideas del álgebra lineal.

Resumen

  • Para probar si un punto crítico de una función multivariable es un mínimo o máximo local, examina la aproximación cuadrática de la función en ese punto. Es más fácil analizar si esta aproximación cuadrática tiene máximos y mínimos.
  • Para funciones de dos variables, esto se reduce al estudio de una expresión que tiene este aspecto:
ax2+2bxy+cy2
Estas se conocen como formas cuadráticas. La regla para saber cuándo una forma cuadrática es siempre positiva o siempre negativa se traduce directamente al criterio de la segunda derivada parcial.

¿Quieres unirte a la conversación?

¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.