Contenido principal
Cálculo multivariable
Curso: Cálculo multivariable > Unidad 3
Lección 6: Optimización restringida (artículos)Introducción a los multiplicadores de Lagrange
La técnica de los "multiplicadores de Lagrange" es una forma de resolver problemas de optimización con restricciones. ¡Súper útil!
Qué vamos a construir:
- La técnica de los multiplicadores de Lagrange te permite encontrar el máximo o el mínimo de una función multivariable,
, cuando hay alguna restricción en los valores de entrada que puedes usar. - Esta técnica solo se aplica a restricciones que se ven así:Aquí,
es otra función multivariable con el mismo espacio de entrada que y es alguna constante. - La idea central es buscar puntos en donde las curvas de nivel de
y sean tangentes entre sí. - Esto es lo mismo que encontrar puntos en donde los vectores de los gradientes de
y sean paralelos entre sí. - Todo el proceso puede reducirse a hacer el gradiente de una cierta función, llamada el lagrangiano, igual al vector cero.
Un ejemplo para motivarte
Supón que quieres maximizar esta función
Pero también digamos que limitaste los valores de entrada que satisfacen la siguiente ecuación:
En otras palabras, ¿para qué punto sobre el el valor de es máximo?
Esto es lo que se conoce como un problema de optimización con restricciones. La condición de usar puntos que satisfacen se llama una "restricción", y es la función que necesita ser optimizada.
He aquí una manera de visualizar el problema: primero dibuja la gráfica de , que se ve como un plano inclinado, pues es lineal. Después proyecta el círculo verticalmente del plano sobre la gráfica de . El valor máximo que buscamos corresponde al punto más alto de este círculo proyectado sobre la gráfica.
La forma más general
En general, los problemas de optimización con restricciones involucran maximizar o minimizar una función multivariable cuya entrada tiene cualquier número de dimensiones:
Sin embargo, su salida siempre será unidimensional, ya que no hay una noción clara del "máximo" para funciones con valores vectoriales.
El tipo de restricciones con los que se aplica la técnica de los multiplicadores de Lagrange debe tomar la forma de otra función multivariable que sea igual a una constante .
Como esta va a ser una restricción sobre la entrada de , el número de dimensiones en la entrada de es el mismo que el de . El ejemplo descrito antes cumple esta forma general de la siguiente manera:
Usar mapas de curvas de nivel
Razonar acerca de este problema se vuelve más fácil si visualizamos no con una gráfica, sino con sus curvas de nivel.
Como un recordatorio, una curva de nivel de es el conjunto de todos los puntos donde para alguna constante . La siguiente herramienta interactiva muestra cómo esta recta (dibujada en azul) cambia conforme la constante cambia. El círculo también se muestra (en rojo). Trata de hacer lo más grande o más chica que puedas sin que deje de intersecar el círculo.
Verificación de conceptos: ¿qué significa que para un valor particular de , la recta azul que representa a no interseque el círculo rojo que representa a ?
Observa que el círculo puede pensarse como una curva de nivel particular de la función . Así que con eso, esta es la manera inteligente de pensar acerca de problemas de optimización con restricciones:
Observación clave: los valores máximo y mínimo de , sujetos a la restricción , corresponden a las curvas de nivel de que son tangentes a la curva de nivel que representa .
Si fuera una función diferente, sus curvas de nivel podrían no ser siempre líneas rectas. Esto pasa en nuestro ejemplo, pues es lineal. Por ejemplo, mira esta función:
,
Sus curvas de nivel se ven así:
Dicho esto, la observación clave se mantiene y vale la pena repetirla: cuando es un máximo o un mínimo de sujeto a la restricción, la curva de nivel de será tangente a la curva que representa .
Dónde entra en juego el gradiente
¿Cómo reflejar, en una fórmula que podamos resolver, la idea de que dos curvas de nivel sean tangentes?
Para responder esto, recurrimos a nuestro fiel amigo el gradiente. Hay muchas maneras de interpretar : la dirección de ascenso más pronunciado, una herramienta para calcular derivadas direccionales, etc. Pero para nuestro propósito, la propiedad que nos interesa es que el gradiente de evaluado en el punto siempre da un vector perpendicular a la curva de nivel que pasa por ese punto.
Esto significa que cuando las curvas de nivel de dos funciones y son tangentes, sus vectores gradientes son paralelos. Así es como se podrían ver para dos funciones arbitrarias y :
El hecho de que las curvas de nivel sean tangentes no nos dice nada acerca de la magnitud de cada uno de estos vectores gradientes, pero eso está bien. Cuando dos vectores apuntan en la misma dirección, significa que podemos multiplicar cualquiera de los dos por una constante para obtener el otro. Específicamente, sea un punto particular donde las curvas de nivel de y son tangentes (escribir y con subíndices solo indica que estamos considerando valores constantes y, por lo tanto, un punto específico). Ya que esta tangencia significa que los vectores gradientes se alinean, esto es lo que podrías escribir:
Aquí, representa alguna constante. Hay autores que usan una constante negativa , pero preferimos una constante positiva, pues se obtiene una interpretación más limpia de .
Veamos cómo se ve esto en nuestro ejemplo, donde and . El gradiente de es
y el gradiente de es
Por lo tanto, la condición de tangencia termina por verse así:
Resolver el problema en el caso específico
Para resumir en donde estamos hasta ahora, buscamos puntos de entrada con las siguientes propiedades:
, que para nuestro ejemplo significa para alguna constante , que para nuestro ejemplo significa
Hay ecuaciones con incógnitas, así que podemos encontrar una solución.
La función lagrangiana
En los 1700s, nuestro amigo Joseph Louis Lagrange estudió problemas de optimización con restricciones de este tipo, y encontró una manera muy inteligente para expresar todas nuestras condiciones en una sola ecuación.
Puedes escribir estas condiciones de manera general al decir que estamos buscando constantes , y que satisfagan las siguientes condiciones:
- La restricción:
- La condición de tangencia:
.Esto se puede dividir en sus componentes como sigue:
Lagrange escribió una nueva función especial que toma las mismas variables de entrada que y , junto con , que ahora pensamos como una variable en lugar de una constante.
Por ejemplo, considera nuestro ejemplo anterior.
Así es cómo se vería esta nueva función:
Observa que la derivada parcial de con respecto a es :
Así que podemos traducir la condición como
Es más, mira lo que obtenemos cuando hacemos una de las derivadas parciales igual a :
¡Eso resulta ser otra de nuestras otras condiciones! De manera casi idéntica, la condición se revela como
Juntas, estas condiciones son lo mismo que decir
Por lo tanto, las tres condiciones que necesitamos resolver para encontrar y se resumen a que las derivadas parciales de sean iguales a . Esto se puede escribir de manera extremadamente compacta al hacer el gradiente de igual al vector cero:
Por ejemplo, con nuestras funciones específicas de arriba, vemos que esto conforma el sistema de ecuaciones que tenemos que resolver:
Como un tributo a Joseph Louis, a esta función la llamamos el "lagrangiano", y la nueva variable que introdujimos se llama un "multiplicador de Lagrange". Imagínate que alguien le agregara "iano" al final de tu apellido y lo hiciera el nombre de una función que todo mundo usa. ¡Genial!, ¿no?
Advertencia: algunos autores usan la convención en la que invierten el signo de :
Esto no hace ninguna diferencia cuando se trata de resolver el problema, pero debes tenerlo en mente si el curso que estás tomando o el texto que estás leyendo sigue esta convención.
Resumen
Cuando quieres maximizar (o minimizar) una función multivariable sujeta a la restricción de que otra función multivariable sea igual a una constante , sigue estos pasos:
- Paso 1: introduce una nueva variable
y define una nueva función como sigue:Esta función se llama el "lagrangiano", y a la nueva variable se le conoce como un "multiplicador de Lagrange". - Paso 2: haz el gradiente de
igual al vector cero.En otras palabras, encuentra los puntos críticos de . - Paso 3: considera cada solución, que se ve algo así como
. Sustituye cada uno en . O, más bien, primero quita la componente y luego sustituye cada uno en , pues no tiene como valor de entrada. El que te de el valor más grande (o más pequeña) es el punto máximo (o mínimo) que buscas.
¿Quieres unirte a la conversación?
- ¿Cómo se diferencia un máximo de un mínimo en el uso de la función de Lagrange?(7 votos)
- Y si obtengo un solo valor, ¿Como sé si es máximo o mínimo?(3 votos)
- Hallar el valor máximo de A(x;y)=xy , sujeto a la restricción x + y = 20
200
100
300
400(5 votos) - Hola. Tengo una pregunta respecto a la función de Lagrange. Se tiene la condición de que (Ly denota a la derivada del lagrangiano respecto a y) y*Ly = 0. luego se tiene que para que esto se cumpla (y=0 y Ly<0) o (y>0 y Ly=0). Lo mismo ocurre en el caso de que se tome x*Lx. Mi pregunta es: gráficamente, ¿qué significa esto? ¿Cual es la interpretación que tienen estas restricciones? Muchas gracias.(2 votos)
- Buen ejemplo para aplicarlo
excelemte(1 voto)