If you're seeing this message, it means we're having trouble loading external resources on our website.

Si estás detrás de un filtro de páginas web, por favor asegúrate de que los dominios *.kastatic.org y *.kasandbox.org estén desbloqueados.

Contenido principal

Introducción a los multiplicadores de Lagrange

La técnica de los "multiplicadores de Lagrange" es una forma de resolver problemas de optimización con restricciones. ¡Súper útil!

Qué vamos a construir:

  • La técnica de los multiplicadores de Lagrange te permite encontrar el máximo o el mínimo de una función multivariable, start color #0c7f99, f, left parenthesis, x, comma, y, comma, dots, right parenthesis, end color #0c7f99, cuando hay alguna restricción en los valores de entrada que puedes usar.
  • Esta técnica solo se aplica a restricciones que se ven así:
    start color #bc2612, g, left parenthesis, x, comma, y, comma, dots, right parenthesis, equals, c, end color #bc2612
    Aquí, start color #bc2612, g, end color #bc2612 es otra función multivariable con el mismo espacio de entrada que start color #0c7f99, f, end color #0c7f99 y start color #bc2612, c, end color #bc2612 es alguna constante.
  • La idea central es buscar puntos en donde las curvas de nivel de start color #0c7f99, f, end color #0c7f99 y start color #bc2612, g, end color #bc2612 sean tangentes entre sí.
  • Esto es lo mismo que encontrar puntos en donde los vectores de los gradientes de start color #0c7f99, f, end color #0c7f99 y start color #bc2612, g, end color #bc2612 sean paralelos entre sí.
  • Todo el proceso puede reducirse a hacer el gradiente de una cierta función, llamada el lagrangiano, igual al vector cero.

Un ejemplo para motivarte

Supón que quieres maximizar esta función
start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, equals, 2, x, plus, y, end color #0c7f99
Gráfica de la función f, left parenthesis, x, comma, y, right parenthesis, equals, 2, x, plus, y
Gráfica de la función f, left parenthesis, x, comma, y, right parenthesis, equals, 2, x, plus, y
Pero también digamos que limitaste los valores de entrada left parenthesis, x, comma, y, right parenthesis que satisfacen la siguiente ecuación:
start color #bc2612, x, squared, plus, y, squared, equals, 1, end color #bc2612
El círculo unitario
Todos los puntos left parenthesis, x, comma, y, right parenthesis que satisfacen start color #bc2612, x, squared, plus, y, squared, equals, 1, end color #bc2612 están en el círculo unitario.
En otras palabras, ¿para qué punto left parenthesis, x, comma, y, right parenthesis sobre el start color #bc2612, start text, c, ı, with, \', on top, r, c, u, l, o, space, u, n, i, t, a, r, i, o, end text, end color #bc2612 el valor de start color #0c7f99, 2, x, plus, y, end color #0c7f99 es máximo?
Esto es lo que se conoce como un problema de optimización con restricciones. La condición de usar puntos que satisfacen start color #bc2612, x, squared, plus, y, squared, equals, 1, end color #bc2612 se llama una "restricción", y start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, equals, 2, x, plus, y, end color #0c7f99 es la función que necesita ser optimizada.
He aquí una manera de visualizar el problema: primero dibuja la gráfica de start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, end color #0c7f99, que se ve como un plano inclinado, pues start color #0c7f99, f, end color #0c7f99 es lineal. Después proyecta el círculo start color #bc2612, x, squared, plus, y, squared, equals, 1, end color #bc2612 verticalmente del plano x, y sobre la gráfica de start color #0c7f99, f, end color #0c7f99. El valor máximo que buscamos corresponde al punto más alto de este círculo proyectado sobre la gráfica.
Contenedor video de Khan Academy

La forma más general

En general, los problemas de optimización con restricciones involucran maximizar o minimizar una función multivariable cuya entrada tiene cualquier número de dimensiones:
start color #0c7f99, f, left parenthesis, x, comma, y, comma, z, comma, dots, right parenthesis, end color #0c7f99
Sin embargo, su salida siempre será unidimensional, ya que no hay una noción clara del "máximo" para funciones con valores vectoriales.
El tipo de restricciones con los que se aplica la técnica de los multiplicadores de Lagrange debe tomar la forma de otra función multivariable start color #bc2612, g, left parenthesis, x, comma, y, comma, z, comma, dots, right parenthesis, end color #bc2612 que sea igual a una constante start color #bc2612, c, end color #bc2612.
start color #bc2612, g, left parenthesis, x, comma, y, comma, z, comma, dots, right parenthesis, equals, c, end color #bc2612
Como esta va a ser una restricción sobre la entrada de start color #0c7f99, f, end color #0c7f99, el número de dimensiones en la entrada de start color #bc2612, g, end color #bc2612 es el mismo que el de start color #0c7f99, f, end color #0c7f99. El ejemplo descrito antes cumple esta forma general de la siguiente manera:
start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, equals, 2, x, plus, y, end color #0c7f99
start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, equals, x, squared, plus, y, squared, end color #bc2612
start color #bc2612, c, equals, 1, end color #bc2612

Usar mapas de curvas de nivel

Razonar acerca de este problema se vuelve más fácil si visualizamos start color #0c7f99, f, end color #0c7f99 no con una gráfica, sino con sus curvas de nivel.
Como un recordatorio, una curva de nivel de start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, end color #0c7f99 es el conjunto de todos los puntos donde start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, equals, k, end color #0c7f99 para alguna constante k. La siguiente herramienta interactiva muestra cómo esta recta (dibujada en azul) cambia conforme la constante k cambia. El círculo start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, equals, 1, end color #bc2612 también se muestra (en rojo). Trata de hacer k lo más grande o más chica que puedas sin que start color #0c7f99, f, end color #0c7f99 deje de intersecar el círculo.
Verificación de conceptos: ¿qué significa que para un valor particular de k, la recta azul que representa a start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, equals, k, end color #0c7f99 no interseque el círculo rojo que representa a start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, equals, 1, end color #bc2612?
Escoge 1 respuesta:

Observa que el círculo start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, equals, 1, end color #bc2612 puede pensarse como una curva de nivel particular de la función start color #bc2612, g, end color #bc2612. Así que con eso, esta es la manera inteligente de pensar acerca de problemas de optimización con restricciones:
Observación clave: los valores máximo y mínimo de start color #0c7f99, f, end color #0c7f99, sujetos a la restricción start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, equals, 1, end color #bc2612, corresponden a las curvas de nivel de start color #0c7f99, f, end color #0c7f99 que son tangentes a la curva de nivel que representa start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, equals, 1, end color #bc2612.
Los extremos restringidos son tangentes.
Si start color #0c7f99, f, end color #0c7f99 fuera una función diferente, sus curvas de nivel podrían no ser siempre líneas rectas. Esto pasa en nuestro ejemplo, pues start color #0c7f99, f, end color #0c7f99 es lineal. Por ejemplo, mira esta función:
start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, equals, 2, x, squared, plus, square root of, 5, y, end square root, end color #0c7f99,
Sus curvas de nivel se ven así:
Dicho esto, la observación clave se mantiene y vale la pena repetirla: cuando k es un máximo o un mínimo de f sujeto a la restricción, la curva de nivel de start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, equals, k, end color #0c7f99 será tangente a la curva que representa start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, equals, 1, end color #bc2612.

Dónde entra en juego el gradiente

¿Cómo reflejar, en una fórmula que podamos resolver, la idea de que dos curvas de nivel sean tangentes?
Para responder esto, recurrimos a nuestro fiel amigo el gradiente. Hay muchas maneras de interpretardel, f: la dirección de ascenso más pronunciado, una herramienta para calcular derivadas direccionales, etc. Pero para nuestro propósito, la propiedad que nos interesa es que el gradiente de f evaluado en el punto left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis siempre da un vector perpendicular a la curva de nivel que pasa por ese punto.
Los vectores gradientes son perpendiculares a las curvas de nivel.
Esto significa que cuando las curvas de nivel de dos funciones start color #0c7f99, f, end color #0c7f99 y start color #bc2612, g, end color #bc2612 son tangentes, sus vectores gradientes son paralelos. Así es como se podrían ver para dos funciones arbitrarias start color #0c7f99, f, end color #0c7f99 y start color #bc2612, g, end color #bc2612:
Imagen de Wikipedia de curvas de nivel tangentes
El hecho de que las curvas de nivel sean tangentes no nos dice nada acerca de la magnitud de cada uno de estos vectores gradientes, pero eso está bien. Cuando dos vectores apuntan en la misma dirección, significa que podemos multiplicar cualquiera de los dos por una constante para obtener el otro. Específicamente, sea left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis un punto particular donde las curvas de nivel de start color #0c7f99, f, end color #0c7f99 y start color #bc2612, g, end color #bc2612 son tangentes (escribir x, start subscript, 0, end subscript y y, start subscript, 0, end subscript con subíndices 0 solo indica que estamos considerando valores constantes y, por lo tanto, un punto específico). Ya que esta tangencia significa que los vectores gradientes se alinean, esto es lo que podrías escribir:
f(x0,y0)=λ0g(x0,y0)\begin{aligned} \nabla \blueE{f(x_0, y_0)} = \greenE{\lambda}_0 \nabla \redE{g(x_0, y_0)} \end{aligned}
Aquí, start color #0d923f, lambda, end color #0d923f, start subscript, 0, end subscript representa alguna constante. Hay autores que usan una constante negativa minus, start color #0d923f, lambda, end color #0d923f, start subscript, 0, end subscript, pero preferimos una constante positiva, pues se obtiene una interpretación más limpia de start color #0d923f, lambda, start subscript, 0, end subscript, end color #0d923f.
Veamos cómo se ve esto en nuestro ejemplo, donde start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, equals, 2, x, plus, y, end color #0c7f99 and start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, equals, x, squared, plus, y, squared, end color #bc2612. El gradiente de f es
f(x,y)=[x(2x+y)y(2x+y)]=[21]\begin{aligned} \nabla f(x, y) = \left[ \begin{array}{c} \dfrac{\partial}{\partial \blueD{x}}(2\blueD{x} + y) \\ \\ \dfrac{\partial}{\partial \redD{y}}(2x + \redD{y}) \\ \end{array} \right] = \left[ \begin{array}{c} 2 \\ 1 \end{array} \right] \end{aligned}
y el gradiente de g es
g(x,y)=[x(x2+y21)y(x2+y21)]=[2x2y]\begin{aligned} \nabla g(x, y) = \left[ \begin{array}{c} \dfrac{\partial}{\partial \blueD{x}}(\blueD{x}^2 + y^2 - 1) \\ \\ \dfrac{\partial}{\partial \redD{y}}(x^2 + \redD{y}^2 - 1) \\ \end{array} \right] = \left[ \begin{array}{c} 2x \\ 2y \end{array} \right] \end{aligned}
Por lo tanto, la condición de tangencia termina por verse así:
[21]=λ0[2x02y0]\begin{aligned} \left[ \begin{array}{c} 2 \\ 1 \end{array} \right] = \greenE{\lambda_0} \left[ \begin{array}{c} 2x_0 \\ 2y_0 \end{array} \right] \end{aligned}

Resolver el problema en el caso específico

Para resumir en donde estamos hasta ahora, buscamos puntos de entrada left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis con las siguientes propiedades:
  • g, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, equals, 1, que para nuestro ejemplo significa
    start color #bc2612, x, start subscript, 0, end subscript, squared, plus, y, start subscript, 0, end subscript, squared, equals, 1, end color #bc2612
  • del, f, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, equals, start color #0d923f, lambda, start subscript, 0, end subscript, end color #0d923f, del, g, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis para alguna constante start color #0d923f, lambda, start subscript, 0, end subscript, end color #0d923f, que para nuestro ejemplo significa
    2=2λ0x01=2λ0y0\begin{aligned} \quad {2} &{= 2\greenE{\lambda_0} x_0} \\ {1} &{= 2\greenE{\lambda_0} y_0} \end{aligned}
Hay 3 ecuaciones con 3 incógnitas, así que podemos encontrar una solución.

La función lagrangiana

Foto de Lagrange
Joseph Louis Lagrange, con una mirada tranquila, satisfecho, y con sueño, todo al mismo tiempo. Wikimedia Commons
En los 1700s, nuestro amigo Joseph Louis Lagrange estudió problemas de optimización con restricciones de este tipo, y encontró una manera muy inteligente para expresar todas nuestras condiciones en una sola ecuación.
Puedes escribir estas condiciones de manera general al decir que estamos buscando constantes x, start subscript, 0, end subscript, y, start subscript, 0, end subscript y lambda, start subscript, 0, end subscript que satisfagan las siguientes condiciones:
  • La restricción:
    start color #bc2612, g, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, equals, c, end color #bc2612
  • La condición de tangencia:
    del, f, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, equals, lambda, start subscript, 0, end subscript, del, g, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis.
    Esto se puede dividir en sus componentes como sigue:
  • f, start subscript, x, end subscript, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, equals, lambda, start subscript, 0, end subscript, g, start subscript, x, end subscript, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis
  • f, start subscript, y, end subscript, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, equals, lambda, start subscript, 0, end subscript, g, start subscript, y, end subscript, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis
Lagrange escribió una nueva función especial que toma las mismas variables de entrada que f y g, junto con lambda, que ahora pensamos como una variable en lugar de una constante.
L, left parenthesis, x, comma, y, comma, lambda, right parenthesis, equals, start color #0c7f99, f, left parenthesis, x, comma, y, right parenthesis, end color #0c7f99, minus, lambda, left parenthesis, start color #bc2612, g, left parenthesis, x, comma, y, right parenthesis, minus, c, end color #bc2612, right parenthesis
Por ejemplo, considera nuestro ejemplo anterior.
f(x,y)=2x+yg(x,y)=x2+y2c=1\begin{aligned} \quad \blueE{f(x, y)} &= \blueE{2x + y }\\ \redE{g(x, y)} &= \redE{x^2 + y^2} \\ \redE{c} &= \redE{1} \\ \end{aligned}
Así es cómo se vería esta nueva función:
L, left parenthesis, x, comma, y, comma, lambda, right parenthesis, equals, start color #0c7f99, 2, x, plus, y, end color #0c7f99, minus, lambda, left parenthesis, start color #bc2612, x, squared, plus, y, squared, minus, 1, end color #bc2612, right parenthesis, point
Observa que la derivada parcial de L con respecto a lambda es minus, left parenthesis, g, left parenthesis, x, comma, y, right parenthesis, minus, c, right parenthesis:
Lλ(x,y,λ)=λ(f(x,y)λ(g(x,y)c)=0(g(x,y)c)\begin{aligned} \quad \mathcal{L}_\lambda(x, y, \lambda) &= \dfrac{\partial}{\partial \lambda}\left(f(x, y) - \lambda (g(x, y)-c \right) \\ &= 0 - (g(x, y)-c) \end{aligned}
Así que podemos traducir la condición g, left parenthesis, x, comma, y, right parenthesis, equals, c como
Lλ(x,y,λ)=g(x,y)+c=0\begin{aligned} \quad \redE{ \mathcal{L}_\lambda(x, y, \lambda) = -g(x, y) + c = 0 } \end{aligned}
Es más, mira lo que obtenemos cuando hacemos una de las derivadas parciales igual a 0:
Lx(x,y,λ)=0x(f(x,y)λ(g(x,y)c))=0fx(x,y)λgx(x,y)=0fx(x,y)=λgx(x,y)\begin{aligned} \quad \mathcal{L}_x(x, y, \lambda) &= 0 \\ \\ \dfrac{\partial}{\partial x}(f(x, y) - \lambda (g(x, y)-c)) &= 0 \\ \\ f_x(x, y) - \lambda g_x(x, y) &= 0 \\ \\ {f_x(x, y)} &{= \lambda g_x(x, y)} \end{aligned}
¡Eso resulta ser otra de nuestras otras condiciones! De manera casi idéntica, la condición L, start subscript, y, end subscript, left parenthesis, x, comma, y, comma, lambda, right parenthesis, equals, 0 se revela como
fy(x,y)=λgy(x,y)\begin{aligned} \quad {f_y(x, y) = \lambda g_y(x, y)} \end{aligned}
Juntas, estas condiciones son lo mismo que decir
f(x,y)=λg(x,y)\begin{aligned} \quad \nabla f(x, y) = \lambda \nabla g(x, y) \end{aligned}
Por lo tanto, las tres condiciones que necesitamos resolver para encontrar x, comma, y y lambda se resumen a que las derivadas parciales de L sean iguales a 0. Esto se puede escribir de manera extremadamente compacta al hacer el gradiente de L igual al vector cero:
L=0\begin{aligned} \quad \nabla \mathcal{L} = \textbf{0} \end{aligned}
Por ejemplo, con nuestras funciones específicas de arriba, vemos que esto conforma el sistema de ecuaciones que tenemos que resolver:
L=[x(2x+yλ(x2+y21))y(2x+yλ(x2+y21))λ(2x+yλ(x2+y21))]=[22λx12λyx2y2+1]=[000]\begin{aligned} \quad \nabla \mathcal{L} = \left[ \begin{array}{c} \dfrac{\partial}{\partial x}(2x + y - \lambda(x^2 + y^2 - 1)) \\ \\ \dfrac{\partial}{\partial y}(2x + y - \lambda(x^2 + y^2 - 1)) \\ \\ \dfrac{\partial}{\partial \lambda}(2x + y - \lambda(x^2 + y^2 - 1)) \\ \\ \end{array} \right] = \left[ \begin{array}{c} 2 - 2\lambda x \\ 1 - 2\lambda y \\ -x^2 - y^2 + 1 \\ \end{array} \right] = \left[ \begin{array}{c} 0 \\ 0 \\ 0 \\ \end{array} \right] \end{aligned}
Como un tributo a Joseph Louis, a esta función L la llamamos el "lagrangiano", y la nueva variable lambda que introdujimos se llama un "multiplicador de Lagrange". Imagínate que alguien le agregara "iano" al final de tu apellido y lo hiciera el nombre de una función que todo mundo usa. ¡Genial!, ¿no?
Advertencia: algunos autores usan la convención en la que invierten el signo de lambda:
L(x,y,λ)=f(x,y)+λ(g(x,y)c)\begin{aligned} \quad \mathcal{L}(x, y, \lambda) = f(x, y) \redE{+} \lambda (g(x, y)-c) \end{aligned}
Esto no hace ninguna diferencia cuando se trata de resolver el problema, pero debes tenerlo en mente si el curso que estás tomando o el texto que estás leyendo sigue esta convención.

Resumen

Optimización restringida
Crédito de la imagen: por Nexcis (trabajo propio) [Dominio público], a través de Wikimedia Commons
Cuando quieres maximizar (o minimizar) una función multivariable start color #0c7f99, f, left parenthesis, x, comma, y, comma, dots, right parenthesis, end color #0c7f99 sujeta a la restricción de que otra función multivariable sea igual a una constante start color #bc2612, g, left parenthesis, x, comma, y, comma, dots, right parenthesis, equals, c, end color #bc2612, sigue estos pasos:
  • Paso 1: introduce una nueva variable start color #0d923f, lambda, end color #0d923f y define una nueva función L como sigue:
    L, left parenthesis, x, comma, y, comma, dots, comma, start color #0d923f, lambda, end color #0d923f, right parenthesis, equals, start color #0c7f99, f, left parenthesis, x, comma, y, comma, dots, right parenthesis, end color #0c7f99, minus, start color #0d923f, lambda, end color #0d923f, left parenthesis, start color #bc2612, g, left parenthesis, x, comma, y, comma, dots, right parenthesis, minus, c, end color #bc2612, right parenthesis
    Esta función L se llama el "lagrangiano", y a la nueva variable start color #0d923f, lambda, end color #0d923f se le conoce como un "multiplicador de Lagrange".
  • Paso 2: haz el gradiente de L igual al vector cero.
    del, L, left parenthesis, x, comma, y, comma, dots, comma, start color #0d923f, lambda, end color #0d923f, right parenthesis, equals, start bold text, 0, end bold text, left arrow, start color gray, start text, V, e, c, t, o, r, space, c, e, r, o, end text, end color gray
    En otras palabras, encuentra los puntos críticos de L.
  • Paso 3: considera cada solución, que se ve algo así como left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, comma, dots, comma, start color #0d923f, lambda, end color #0d923f, start subscript, 0, end subscript, right parenthesis. Sustituye cada uno en f. O, más bien, primero quita la componente start color #0d923f, lambda, end color #0d923f, start subscript, 0, end subscript y luego sustituye cada uno en f, pues f no tiene start color #0d923f, lambda, end color #0d923f como valor de entrada. El que te de el valor más grande (o más pequeña) es el punto máximo (o mínimo) que buscas.

¿Quieres unirte a la conversación?

¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.