If you're seeing this message, it means we're having trouble loading external resources on our website.

Si estás detrás de un filtro de páginas web, por favor asegúrate de que los dominios *.kastatic.org y *.kasandbox.org estén desbloqueados.

Contenido principal

Máximos, mínimos y puntos silla

Aprende cómo se ven los máximos/mínimos locales en una función multivariable.

Qué vamos a construir

  • Intuitivamente, cuando piensas en términos de gráficas, los máximos locales de funciones multivariables son picos, al igual que con las funciones de una sola variable.
  • El gradiente de una función multivariable en un punto máximo será el vector cero, que corresponde al lugar en el que la gráfica tiene un plano tangente horizontal.
  • Formalmente hablando, un punto máximo local es un punto en el espacio de entrada tal que que todas las otras entradas en una pequeña región cerca de ese punto producen valores más pequeños cuando se introducen en la función multivariable f.

Optimizar en dimensiones superiores

Una de las aplicaciones más importantes del cálculo es su utilidad para permitirnos encontrar el máximo o el mínimo de una función.
  • Imagina que terminas siendo el jefe de una empresa, y que se te ha ocurrido que cierta función puede modelar cuánto dinero esperas ganar con base en un número de parámetros tales como los salarios de los empleados, el costo de las materias primas, etc., y quieres encontrar la combinación correcta de los recursos que maximiza tus ingresos.
  • Quizás estás diseñando un automóvil con la esperanza de hacerlo más aerodinámico y se te ocurra una función que modele la resistencia del viento total en función de muchos parámetros que definan la forma del auto, y quieras encontrar la forma que minimiza resistencia total.
  • En aprendizaje automático e inteligencia artificial, la manera en la que una computadora "aprende" a hacer algo es usualmente al minimizar alguna "función de costo" que el programador ha especificado.

Máximos y mínimos locales, visualmente

Vamos a empezar por pensar en funciones multivariables que podamos graficar; aquellas con una entrada de dos dimensiones y una salida escalar. Como esta:
f(x,y)=cos(x)cos(y)ex2y2
Elegimos esta función ya que tiene un montón de pequeñas protuberancias y picos. Llamamos a uno de estos picos un máximo local.
Picos
  • Al punto (x0,y0) por debajo de un pico en el espacio de entrada (que en este caso se refiere al plano xy) se le llama un punto máximo local.
  • La salida de una función en un punto máximo local, que se puede visualizar como la altura de la gráfica por encima de ese punto, es en sí el máximo local.
La palabra "local" se utiliza para distinguirlo del máximo global de la función, que es el único mayor valor que la función puede alcanzar. Si estás en la cima de una montaña, es un máximo local, pero a menos que la montaña sea el Monte Everest, no es un pico máximo global.
Al final de este artículo daremos la definición formal de un punto máximo local. Intuitivamente, es un punto especial en el espacio de entrada donde si nos desplazamos un poco en cualquier dirección, el valor de la función solo puede disminuir.
Del mismo modo, si la gráfica tiene un pico invertido en un punto, decimos que la función tiene un punto mínimo local en el valor (x,y), por arriba o por debajo de este punto en el plano de xy, y el valor de la función en este punto es un mínimo local. Intuitivamente, estos son puntos donde al movernos un poco en cualquier dirección el valor de la función solo puede aumentar.
Valles

Puntos críticos en una sola variable (repaso)

Las rectas tangentes en extremos locales tienen pendiente 0
Las rectas tangentes en extremos locales tienen pendiente 0
Puede ser que recuerdes la idea de máximos/mínimos locales en el cálculo de una variable, donde ves muchos problemas como este:
Verificación de conceptos: ¿para qué valor de x el valor de la función f(x)=(x2)2+5 es el más grande? ¿Cuál es el valor máximo?
x=
El valor máximo de f es

En general, los máximos y mínimos locales de una función f se estudian al examinar los valores de entrada a para los cuales f(a)=0. Esto es porque siempre que la función sea continua y diferenciable, la recta tangente en cimas y valles se hará horizontal, es decir tendrá pendiente 0.
Uno de esos puntos a tiene diversos nombres:
  • Punto crítico
  • Punto estable
  • Punto estacionario
Todos significan lo mismo: f(a)=0
El requisito de que f sea continua y diferenciable es importante, pues si no fuera continua, un punto solitario de discontinuidad podría ser un máximo local:
Y si f fuera continua pero no diferenciable, un máximo local se podría ver así:
En cualquier caso, hablar de rectas tangentes en estos máximos no tiene sentido, ¿o sí?
Sin embargo, aun cuando f sea continua y diferenciable, no es suficiente que la derivada sea 0, pues esto también sucede en los puntos de inflexión:
Recta tangente en un punto de inflexión
Esto significa que encontrar puntos críticos es una buena manera de empezar la búsqueda de un máximo, pero no es necesariamente el final.

Puntos críticos en dos variables

La historia para funciones multivariables es muy similar. Cuando la función es continua y diferenciable, en un máximo o en un mínimo todas las derivadas parciales deben ser 0.
fx(x0,y0,)Parcial con respecto a x.=0fy(x0,y0,)Parcial con respecto a y.=0
Respecto a la gráfica de una función, esto significa que su plano tangente será horizontal en un máximo o mínimo local. Por ejemplo, aquí hay una gráfica con muchos extremos locales y planos tangentes horizontales en cada uno:
Contenedor video de Khan Academy
Decir que todas las derivadas parciales son cero en un punto es lo mismo que decir que el gradiente en ese punto es el vector cero:
=f(x0,y0,)=[fx(x0,y0,)fy(x0,y0,)]=[00]
A menudo esta relación se escribe de manera compacta así:
f(x0)=0
La convención es que las variables en negritas son vectores. Así que x0 es un vector compuesto por los valores de entrada (x0,y0,), y 0 es el vector con todas sus componentes iguales a cero.
Tal entrada x0 toma los mismos nombres que en el caso de una sola variable:
  • Punto crítico
  • Punto estable
  • Punto estacionario
El pensamiento detrás de las palabras "estable" y "estacionario" es que cuando te mueves un poco cerca de este punto, el valor de la función no cambia significativamente. La palabra "crítico" suena un poco dramática, como si la función estuviera cerca de morir en esos puntos.
Como en el cálculo de una sola variable, no es suficiente que el gradiente sea cero para garantizar que un punto sea un máximo o mínimo local. Para empezar, puedes tener también algo similar a un punto de inflexión:
Punto de inflexión en tres dimensiones
Pero también hay una posibilidad totalmente nueva, exclusiva de las funciones multivariables.

Puntos silla

Considera la función f(x,y)=x2y2. Hagamos algunas observaciones de lo que sucede alrededor del orígen (0,0).
  • Ambas derivadas son 0 en este punto:
x(x2y2)=2x2(0)=0y(x2y2)=2y2(0)=0
Por lo tanto (0,0) es un punto crítico.
  • Cuando te mueves en la dirección x alrededor de este punto, la función se ve como f(x,0)=x202=x2. La función de una sola variable f(x)=x2 tiene un mínimo local en x=0.
  • Cuando te mueves en la dirección y alrededor de este punto, la función se ve comof(0,y)=02y2=y2. La función de una sola variable f(y)=y2 tiene un máximo local en y=0.
En otras palabras, las direcciones x y y nos dan información contradictoria con respecto a si en este valor de entrada ocurre un máximo o un mínimo. Así que, aun cuando el punto (0,0) es un punto crítico y no es un punto de inflexión, ¡no puede ser ni un máximo ni un mínimo local!
Aquí mostramos un video de esta gráfica mientras rota en el espacio:
Contenedor video de Khan Academy
¿Acaso la región alrededor de (0,0,0) no se parece la silla de montar de un caballo?
Silla literal.
Bueno, así lo pensaron los matemáticos, y tuvieron uno de esos raros momentos en que decidieron un buen nombre para algo: puntos silla. Por definición, estos son puntos críticos donde la función tiene un máximo local en una dirección, pero un mínimo local en otra.

Prueba del máximo o el mínimo

"Bien,"
Te escucho decir.
"así que no es suficiente que el gradiente sea 0, pues cabe la posibilidad que tengas un punto de inflexión o un punto silla. Pero ¿cómo puedes saber si un punto crítico es un máximo o un mínimo local?"
¡Me alegro que hayas preguntado! Este es el tema del siguiente artículo, que trata del criterio de la segunda derivada parcial. Por ahora, concluyamos con la definición formal de máximo local.

Definición formal

Hemos dicho esto antes, pero la razón para aprender definiciones formales, aun cuando ya tienes cierta intuición, es el exponerte a cómo las ideas matemáticas intuitivas se construyen con precisión. Es una buena práctica para pensar claramente, y también puede ayudar a comprender aquellos casos cuando la intuición difiere de la realidad.
En la definición de un máximo local, vamos a usar la notación vectorial para nuestro valor de entrada, y escribimos x.
Definición formal de máximo local: una función escalar f tiene un máximo local en x0 si existe un número positivo r>0, pensado como un radio, tal que la siguiente proposición es verdadera:
f(x)f(x0) para todo x tal que ||xx0||<r
Eso parece complicado, así que veamos las partes:
Decir "||xx0||<r" significa que la variable x se encuentra a una distancia menor que r del punto máximo x0. Cuando x es bidimensional, esto equivale a decir que x está dentro del círculo de radio r con centro en el punto x0.
Diagrama que muestra el significado de ||xx0||<r
De manera más general, si x es un vector de n dimensiones, el conjunto de x tales que ||xx0||<r forma una bola en dimensión n, de radio r y centro en x0.
Bola tridimensional
Podemos traducir esta definición del lenguaje matemático a algo más parecido al español así:
  • x0 es un punto máximo de f si existe una pequeña región (en forma de bola) en el espacio de entradas alrededor del punto x0, tal que el mayor valor posible de f evaluada en los puntos de esa región se alcanza en el punto x0.
Prueba tu comprensión: escribe la definición formal para un mínimo local, y piensa conforme la escribes qué significa cada componente (y resiste la tentación de simplemente copiar las palabras de la definición anterior).

Resumen

  • Intuitivamente, cuando piensas en términos de gráficas, los máximos locales de funciones multivariables son picos, al igual que con las funciones de una sola variable.
  • El gradiente de una función multivariable en un punto máximo será el vector cero, que corresponde al lugar en el que la gráfica tiene un plano tangente horizontal.
  • Formalmente hablando, un punto máximo local es un punto en el espacio de entrada tal que que todas las otras entradas en una pequeña región cerca de ese punto producen valores más pequeños cuando se introducen en la función multivariable f.

¿Quieres unirte a la conversación?

¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.