La regla de la cadena para derivadas puede extenderse a dimensiones más altas.  Aquí estudiamos cómo se ve en el caso relativamente simple en el que la composición es una función con una variable.

Qué vamos a construir

  • Dada una función multivariable f(x,y)f(x, y), y dos funciones de una sola variable x(t)x(t) y y(t)y(t), la regla de la cadena para funciones multivariables dice:
ddtf(x(t),y(t))Derivada de la funcin composicinoˊoˊ=fxdxdt+fydydt \underbrace{ \dfrac{d}{dt} f(\blueD{x}(t), \redE{y}(t)) }_{\text{Derivada de la función composición}} \!\!\!\!\!\! = \dfrac{\partial f}{\partial \blueD{x}} \dfrac{d\blueD{x}}{dt} + \dfrac{\partial f}{\partial \redE{y}} \dfrac{d\redE{y}}{dt}
  • En notación vectorial v(t)=[x(t)y(t)]\vec{\textbf{v}}(t) = \left[\begin{array}{c} x(t) \\ y(t) \end{array} \right], la fórmula anterior tiene una expresión muy elegante usando el gradiente de ff y la derivada del vector v(t)\vec{\textbf{v}}(t).
ddtf(v(t))Derivada de la funcin composicinoˊoˊ=fv(t)Producto punto de vectores \underbrace{ \dfrac{d}{dt} f(\vec{\textbf{v}}(t)) }_{\text{Derivada de la función composición}} \!\!\!\!\!\! \!\!\!\!\!\! = \overbrace{ \nabla f \cdot \vec{\textbf{v}}'(t) }^{\text{Producto punto de vectores}}

Una regla de la cadena más general

Como probablemente puedes imaginar, la regla de la cadena multivariable generaliza la regla de la cadena para funciones de una sola variable. La regla de la cadena de una sola variable te dice cómo calcular la derivada de una composición de funciones:
ddxf(g(t))=dfdgdgdt=f(g(t))g(t) \dfrac{d}{dx}f(g(t)) = \dfrac{df}{dg} \dfrac{dg}{dt} = f'(g(t))g'(t)
¿Qué pasa si en vez de que la función ff tenga un valor de entrada en una dimensión, tt, tuviera un valor de entrada de dos dimensiones, (x,y)(x, y)?
f(x,y)=alguna expresin de  y alguna de oˊxyf(x, y) = \dots \text{alguna expresión de $x$ y alguna de $y$}\dots
Bueno, en ese caso, no tendría sentido componerla con una función escalar g(t)g(t). En cambio, supongamos que hay dos funciones escalares x(t)x(t) y y(t)y(t), y las introducimos como coordenadas de ff. La composición total será una función de una variable, con tt un solo número de entrada y un solo número de salida f(x(t),y(t))f(x(t), y(t)), tal y como se muestra en este diagrama:
Diagrama que muestra la composición de una función con una entrada y dos salidas con una función que tiene dos entradas y una salida.
Existe una regla de la cadena que te permite calcular la derivada de esta nueva función de una sola variable f(x(t),y(t))f(x(t), y(t)), e involucra a las derivadas parciales de ff:
Disección de la regla de la cadena multivariable
Ten en mente que una expresión como fxdxdt\dfrac{\partial f}{\partial x} \dfrac{dx}{dt} es una abreviación de
fx(x(t),y(t))dxdt(t)\displaystyle \dfrac{\partial f}{\partial x}(x(t), y(t)) \dfrac{dx}{dt}(t)
Es decir, ambas son funciones de tt, pero fx\dfrac{\partial f}{\partial x} se evalúa a través de las funciones intermedias x(t)x(t) y y(t)y(t).

Ahora con notación vectorial

En lugar de pensar en x(t)x(t) y y(t)y(t) como funciones separadas, es común pensarlas como un paquete en una sola función vectorial:
v(t)=[x(t)y(t)]\vec{\textbf{v}}(t) = \left[\begin{array}{c} x(t) \\ y(t) \end{array} \right]
En vez de escribir la composición como f(x(t),y(t))f(x(t), y(t)), la podemos escribir como f(v(t))f(\vec{\textbf{v}}(t)).
Con esta notación, la regla de la cadena para varias variables se puede escribir de manera más compacta usando el producto punto del gradiente de ff con la derivada del vector v(t)\vec{\textbf{v}}(t):
ddtf(v(t))=fx(v(t))dxdt+fy(v(t))dydtReescribe esta suma como un producto punto=[fx(v(t))fy(v(t))]f(v(t))[dxdtdydt]v(t)=f(v(t))v(t)\begin{aligned} \quad \frac{d}{dt} f(\vec{\textbf{v}}(t)) &= \underbrace{ \dfrac{\partial f}{\partial x}(\vec{\textbf{v}}(t)) \dfrac{dx}{dt}+ \dfrac{\partial f}{\partial y}(\vec{\textbf{v}}(t)) \dfrac{dy}{dt} }_{\text{Reescribe esta suma como un producto punto}} \\\\ &= \underbrace{ \left[ \begin{array}{c} \dfrac{\partial f}{\partial x}(\vec{\textbf{v}}(t)) \\ \\ \dfrac{\partial f}{\partial y}(\vec{\textbf{v}}(t)) \\ \end{array} \right] }_{\nabla f(\vec{\textbf{v}}(t))} \cdot \underbrace{ \left[ \begin{array}{c} \dfrac{dx}{dt} \\\\ \dfrac{dy}{dt} \end{array} \right] }_{\vec{\textbf{v}}'(t)}\\\\ &= \nabla f(\vec{\textbf{v}}(t)) \cdot \vec{\textbf{v}}'(t) \end{aligned}
Escrita así, la analogía con las derivadas de una sola variable es más clara.
ddtf(g(t))=f(g(t))g(t)=dfdgdgdt\begin{aligned} \dfrac{d}{dt} f(g(t)) = f'(g(t)) g'(t) = \dfrac{df}{dg} \cdot \dfrac{dg}{dt} \end{aligned}
Solo que ahora f\nabla f juega el papel de la derivada de ff, y el vector v(t)\vec{\textbf{v}}'(t) juega el papel de la derivada ordinaria de gg.

Intuición detrás de la validez de la regla de la cadena

Como calentamiento, considera la regla de la cadena para una función de una sola variable, f(g(t))f(g(t)). Así es como me gusta entender esa composición:
  • En primer lugar, gg asigna a un punto tt de la recta numérica a otro punto g(t)g(t) de la recta.
  • Luego ff le asigna a g(t)g(t) otro número de la recta numérica, f(g(t))f(g(t))
Para entender la derivada de f(g(t))f(g(t)) tienes que entender cómo es que un pequeño cambio en tt cambia el valor de salida final.
Composición de ff y gg
Así que vamos a sumergirnos en lo que realmente está diciendo la regla de la cadena.
ddxf(g(t))=dfdgdgdt \dfrac{d}{dx} f(g(t)) = \blueD{\dfrac{df}{dg}} \cdot \greenD{\dfrac{dg}{dt}}
  • El término dgdt\greenD{\dfrac{dg}{dt}} representa cómo un pequeño cambio en tt influye en el valor intermedio de salida, g(t)g(t).
    dgdt(t0)=limh0g(t0+h)g(t0)h\begin{aligned} \dfrac{dg}{dt}(t_0) = \lim_{h \to 0} \dfrac{g(t_0 + h) - g(t_0)}{h} \end{aligned}
    Si movemos el valor de entrada t0t_0 al valor de entrada t0+ht_0 + h por un pequeño valor hh, el valor de salida de gg cambiará alrededor de
    (dgdt(t0))h\left(\greenD{\dfrac{dg}{dt}}(t_0)\right)\cdot h
    En el límite anterior, puedes multiplicar ambos lados por hh. Entre más pequeño es el valor de hh, más pequeño es el error que hay entre este valor y el cambio real g(t0+h)g(t0)g(t_0 + h) - g(t_0).
  • El término dfdg\blueD{\dfrac{df}{dg}} representa cómo un pequeño cambio en gg influye en el valor de salida f(g(t))f(g(t)).
    dfdg(g(t0))=limk0f(g(t0)+k)f(g(t0))k\begin{aligned} \dfrac{df}{dg}(g(t_0)) = \lim_{k \to 0} \dfrac{f(g(t_0) +k ) - f(g(t_0))}{k} \end{aligned}
    Si movemos el valor de entrada g(t0)g(t_0) al valor de entrada g(t0)+kg(t_0) + k por un pequeño valor kk, el valor de salida de gg cambiará en aproximadamente
    (dfdgg(t0))k\left(\blueD{\dfrac{df}{dg}} g(t_0) \right) \cdot k.
  • El cambio total en ff debido a un cambio pequeño en tt es entonces el producto de ambas influencias.
    Al combinar las dos explicaciones previas, si el cambio en gg ocurrió por un cambio hh en t0t_0, entonces el cambio kk en g(t0)g(t_0) es aproximadamente
    k(dgdt(t0))hk \approx \left(\greenD{\dfrac{dg}{dt}}(t_0)\right) \cdot h.
    Al sustituir este valor de kk, el cambio resultante de ff, que es el que nos interesa, es de (dfdgg(t0))(dgdx(t0))h\begin{aligned} \quad \left(\blueD{\dfrac{df}{dg}} g(t_0) \right) \cdot \left(\greenD{\dfrac{dg}{dx}}(t_0)\right) \cdot h \end{aligned}
    Mientras más pequeño es hh, más certero es este estimado.
    Pregunta de desafío: haz de este un mejor argumento al evaluar
    limh0f(g(t0+h))f(g(t0))h\begin{aligned} \lim_{h \to 0} \dfrac{f(g(t_0+h)) - f(g(t_0))}{h} \end{aligned}
    usando las definiciones basadas en el límite de dfdg\blueD{\dfrac{df}{dg}} y dgdt\greenD{\dfrac{dg}{dt}}.
    (Pista: comienza por reemplazar g(t0+h)g (t_0 + h) con algún valor límite).

Cómo extender este conocimiento intuitivo a más dimensiones

La idea intuitiva para la regla de la cadena multivariable es bastante similar. Puedes pensar que v\vec{\textbf{v}} asigna un punto de la recta numérica a un punto en el plano xyxy, y f(v(t))f(\vec{\textbf{v}}(t)) manda ese punto de regreso hasta algún lugar de la recta numérica. Aquí la cuestión, es preguntarse cómo es que un pequeño cambio en el valor de entrada tt cambia el valor de salida f(v(t))f(\vec{\textbf{v}}(t)).
Composición de ff y textbfv\vec{textbf{v}}
Vamos a entender a fondo la regla de la cadena para funciones de varias variables en términos de las funciones componentes x(t)x(t) y y(t)y(t):
ddtf(v(t))=ddtf(x(t),y(t))=fxdxdt+fydydt \dfrac{d}{dt} f(\vec{\textbf{v}}(t)) = \dfrac{d}{dt} f(x(t), y(t)) = \blueD{\dfrac{\partial f}{\partial x}} \greenD{\dfrac{dx}{dt}} + \blueD{\dfrac{\partial f}{\partial y}} \redD{\dfrac{dy}{dt}}
  • El términodxdt \greenD{\dfrac{dx}{dt}} representa cómo un pequeño cambio en tt influye a la salida intermedia x(t)x(t).
    Para pequeños valores de hh,
    x(t0+h)x(t0)(dxdt(t0))h\begin{aligned} x(t_0 + h) - x(t_0) \approx \left(\greenD{\dfrac{dx}{dt}}(t_0) \right) h \end{aligned}
  • Del mismo modo, el término dydt\redD{\dfrac{dy}{dt}} representa cómo un pequeño cambio en tt influye en la segunda salida intermedia y(t)y(t).
    Para pequeños valores de hh,
    y(t0+h)y(t0)(dydt(t0))h\begin{aligned} y(t_0 + h) - y(t_0) \approx \left(\redD{\dfrac{dy}{dt}}(t_0) \right) h \end{aligned}
  • El término fx\blueD{\dfrac{\partial f}{\partial x}} representa cómo el cambio en la componente xx de una entrada de ff influye en su salida; de manera similar, el término fy\blueD{\dfrac{\partial f}{\partial y}} representa cómo un pequeño cambio en la componente yy de la entrada cambia ff.
    Para pequeños valores de kk,
    f(x0+k,y0)f(x0,y0)(fx(x0,y0))kf(x0,y0+k)f(x0,y0)(fy(x0,y0))k\begin{aligned} f(x_0 + k, y_0) - f(x_0, y_0) &\approx \left(\blueD{\dfrac{\partial f}{\partial x}}(x_0, y_0) \right) k \\ f(x_0 , y_0+k) - f(x_0, y_0) &\approx \left(\blueD{\dfrac{\partial f}{\partial y}}(x_0, y_0) \right) k \end{aligned}
  • Una forma en la que un pequeño cambio en tt influye en f(x(t),y(t))f(x(t), y(t)) es que primero cambia x(t)x(t), que a su vez cambia ff. Este efecto lo captura el producto fxdxdt\blueD{\dfrac{\partial f}{\partial x}} \greenD{\dfrac{dx}{dt}}.
    El cambio en ff debido a una pequeña variación en x(t)x(t), que a su vez es provocada por un pequeño cambio en tt, se expresa de la siguiente manera:
    f(x(t0+h),y(t0))f(x(t0),y(t0))\begin{aligned} f(x(t_0 + h), y(t_0)) &- f(x(t_0), y(t_0)) \end{aligned}
    Sabemos que podemos aproximar x(t0+h)x(t_0 + h) como
    x(t0+h)x(t0)+(dxdt(t0))h\begin{aligned} x(t_0 + h) \approx x(t_0) + \left(\greenD{\dfrac{dx}{dt}}(t_0) \right) h \end{aligned}
    Por lo que la cantidad que nos importa se vuelve
    f(x(t0)+(dxdt(t0))h,y(t0))f(x(t0),y(t0))\begin{aligned} f\left(x(t_0) + \left(\greenD{\dfrac{dx}{dt}}(t_0) \right) h, y(t_0) \right) &- f(x(t_0), y(t_0)) \end{aligned}
    Pero esta expresión tan solo nos pregunta cómo un pequeño cambio en la coordenada xx de la entrada de ff influye la salida, que sabemos que podemos aproximar por medio de la derivada parcial con respecto a xx:
    (fx(x(t0),y(t0)))(dxdt(t0))hUn pequeo cambio en n˜x\begin{aligned} \left(\blueD{\dfrac{\partial f}{\partial x}}(x(t_0), y(t_0)) \right) \overbrace{\left(\greenD{\dfrac{dx}{dt}}(t_0) \right) h}^{\text{Un pequeño cambio en $x$}} \end{aligned}
  • Otra forma en que un cambio en tt cambia el valor de salida de ff es primero cambiando el segundo valor de salida intermedio y(t)y(t), que a su vez afecta la salida de ff. El producto fydydt\blueD{\dfrac{\partial f}{\partial y}} \redD{\dfrac{dy}{dt}} refleja este efecto.
  • Al sumar estos dos productos obtenemos el cambio total en ff.

Conexión con la derivada direccional

Es probable que te hayas dado cuenta que la expresión en forma de producto punto de la regla de la cadena multivariable se parece mucho a la derivada direccional:
f(v(t))v(t)\begin{aligned} \quad \nabla f(\vec{\textbf{v}}(t)) \cdot \vec{\textbf{v}}'(t) \end{aligned}
La derivada es un vector de velocidad tangente a la trayectoria.
De hecho ¡eso es exactamente lo que es! La derivada v(t0)\vec{\textbf{v}}'(t_0) en un valor particular t0t_0 es un vector en el espacio de entradas de ff:
v(t0)=[x(t0)y(t0)]\begin{aligned} \quad \vec{\textbf{v}}'(t_0) = \left[ \begin{array}{c} x'(t_0) \\ y'(t_0) \end{array} \right] \end{aligned}
Si interpretamos v(t)\vec{\textbf{v}}(t) como una curva parametrizada dentro de este espacio, tal vez pensándola como la trayectoria de una partícula, la derivada en un punto particular al tiempo t0t_0 nos da el vector velocidad de esta partícula a ese tiempo.
Con esta interpretación, la regla de la cadena nos dice que la derivada de la composición f(v(t))f(\vec{\textbf{v}}(t)) es la derivada direccional de ff en dirección de la derivada de v(t)\vec{\textbf{v}}(t).
Esto deber tener sentido, pues un cambio pequeño a tt de "dtdt" debe, dado el significado de la derivada, provoca un cambio pequeño dvd \vec{\textbf{v}} a la salida de v(t)\vec{\textbf{v}}(t), y el punto de la derivada direccional es que un cambio pequeño dvd\vec{\textbf{v}} a la entrada de ff provoca un cambio dfdf determinado por fv=vf\dfrac{\partial f}{\partial \vec{\textbf{v}}} = \nabla_{\vec{\textbf{v}}}f.

Ejemplo 1: con y sin la nueva regla de la cadena

Define f(x,y)f(x, y) así:
f(x,y)=x2y\begin{aligned} f(x, y) = x^2y \end{aligned}
Luego define v(t)\vec{\textbf{v}}(t) así:
v(t)=[cos(t)sin(t)]\begin{aligned} \vec{\textbf{v}}(t) = \left[ \begin{array}{c} \cos(t) \\ \sin(t) \end{array} \right] \end{aligned}
Encuentra la derivada ddtf(v(t))\dfrac{d}{dt} f(\vec{\textbf{v}}(t)).
Solución sin la regla de la cadena:
Antes de utilizar nuestra nueva y elegante herramienta, vale la pena señalar que podemos resolver este problema escribiendo la composición como una función de una sola variable tt:
f(v(t))=f(cos(t),sin(t))=cos(t)2sin(t)\begin{aligned} \quad f(\vec{\textbf{v}}(t)) &= f(\cos(t), \sin(t)) \\ &= \cos(t)^2\sin(t) \end{aligned}
Ahora puedes sacar la derivada ordinaria:
ddtcos(t)2sin(t)=cos(t)2(cos(t))+2cos(t)(sin(t))sin(t)=cos3(t)2cos(t)sin2(t)\begin{aligned} \dfrac{d}{dt} \cos(t)^2\sin(t) &= \cos(t)^2(\cos(t)) + 2\cos(t)(-\sin(t))\sin(t) \\ &=\boxed{ \cos^3(t) - 2\cos(t)\sin^2(t)} \end{aligned}
Pero por supuesto, el propósito de este ejemplo es ganar una idea de cómo se siente la regla de la cadena.
Solución usando la regla de la cadena:
Primero, indiquemos explícitamente las componentes vectoriales de la función v(t)\vec{\textbf{v}}(t):
x(t)=cos(t)y(t)=sin(t)\begin{aligned} x(t) &= \cos(t) \\ y(t) &= \sin(t) \end{aligned}
De acuerdo a la regla de la cadena,
ddtf(v(t))=fxdxdt+fydydt\begin{aligned} \dfrac{d}{dt} f(\vec{\textbf{v}}(t)) &= \dfrac{\partial f}{\partial x} \dfrac{dx}{dt} + \dfrac{\partial f}{\partial y} \dfrac{dy}{dt} \\ \end{aligned}
Tomando las derivadas parciales de f(x,y)=x2yf(x, y) = x^2y y las derivadas ordinarias de x(t)=cos(t)x(t) = \cos(t), y(t)=sin(t)y(t) = \sin(t), obtenemos
x(x2y)ddt(cos(t))+y(x2y)ddt(sin(t))=(2xy)(sin(t))+(x2)(cos(t))\begin{aligned} &\quad \dfrac{\partial}{\partial \blueE{x}}(\blueE{x}^2 y) \dfrac{d}{dt}(\cos(t)) + \dfrac{\partial}{\partial \redE{y}}(x^2 \redE{y}) \dfrac{d}{dt}(\sin(t)) \\\\ &= (2\blueE{x}y)(-\sin(t)) + (x^2)(\cos(t)) \end{aligned}
Queremos todo en términos de tt, por lo que sustituimos x=cos(t)x = \cos(t) y y=sin(t)y = \sin(t).
(2xy)(sin(t))+(x2)(cos(t))(2cos(t)sin(t))(sin(t))+(cos(t)2)cos(t)=2cos(t)sin2(t)+cos3(t)\begin{aligned} &(2\blueE{x}y)(-\sin(t)) + (x^2)(\cos(t)) \\\\ &(2\cos(t)\sin(t))(-\sin(t)) + (\cos(t)^2)\cos(t) \\\\ = &\boxed{-2\cos(t)\sin^2(t) + \cos^3(t)} \end{aligned}
Es tranquilizante que la respuesta sea igual que la que obtuvimos sin usar la regla de la cadena. Puedes pensar que esta nueva regla de la cadena complica las cosas de manera innecesaria, y el pequeño secreto sucio es que a menudo no se necesita para cálculos concretos como este.
Sin embargo, es útil para escribir ecuaciones en términos de una función desconocida, como se muestra en el siguiente ejemplo.

Ejemplo 2: función desconocida

Supón que la temperatura en una región bidimensional varía de acuerdo con una función desconocida T(x,y)T(x, y), y que vas por esta región midiendo la temperatura conforme caminas; las coordenadas xx y yy como funciones del tiempo son
x(t)=30cos(2t)y(t)=40sin(3t)\begin{aligned}\quad x(t) &= 30\cos(2t) \\ y(t) &= 40\sin(3t) \end{aligned}
Al medir las temperaturas, te das cuenta que nunca cambian sobre tu trayectoria. ¿Qué puedes decir de las derivadas parciales de TT?
La temperatura que experimentas como función del tiempo es
T(x(t),y(t))=T(30cos(2t),40sin(3t))T(x(t), y(t)) = T(30\cos(2t), 40\sin(3t))
El hecho de que nunca cambie significa que su derivada, como función del tiempo, es 00. Con la regla de la cadena multivariable, podemos escribir la derivada de esta función en términos de las derivadas parciales de TT:
ddtT(x(t),y(t))=Txdxdt+Tydydt=Tx30(2)(sin(2t))+Ty40(3)cos(3t)=Tx60sin(2t)+Ty120cos(3t)\begin{aligned} \frac{d}{dt}T(x(t), y(t)) &= \dfrac{\partial T}{\partial x}\dfrac{dx}{dt} + \dfrac{\partial T}{\partial y}\dfrac{dy}{dt} \\ &= \dfrac{\partial T}{\partial x} \cdot 30(2)(-\sin(2t)) + \dfrac{\partial T}{\partial y} \cdot 40(3)\cos(3t)\\ &= -\dfrac{\partial T}{\partial x} \cdot 60\sin(2t) + \dfrac{\partial T}{\partial y} \cdot 120\cos(3t)\\ \end{aligned}
De manera más precisa, debemos evaluar estas derivadas parciales en (x,y)=(30cos(2t),40sin(3t))(x, y) = (30\cos(2t), 40\sin(3t)), por lo que la expresión completa para lo que sabemos de la función desconocida de temperatura, TT, es
0=Tx(30cos(2t),40sin(3t))60sin(2t)+Ty(30cos(2t),40sin(3t))120cos(3t)\begin{aligned}\quad 0= -&\dfrac{\partial T}{\partial x} (30\cos(2t), 40\sin(3t)) \cdot 60\sin(2t) + \\ &\dfrac{\partial T}{\partial y} (30\cos(2t), 40\sin(3t)) \cdot 120\cos(3t) \end{aligned}

Resumen

  • Dada una función multivariable f(x,y)f(x, y), y dos funciones de una sola variable x(t)x(t) y y(t)y(t), la regla de la cadena para funciones multivariables dice:
ddtf(x(t),y(t))Derivada de la funcin composicinoˊoˊ=fxdxdt+fydydt \underbrace{ \dfrac{d}{dt} f(\blueD{x}(t), \redE{y}(t)) }_{\text{Derivada de la función composición}} \!\!\!\!\!\! = \dfrac{\partial f}{\partial \blueD{x}} \dfrac{d\blueD{x}}{dt} + \dfrac{\partial f}{\partial \redE{y}} \dfrac{d\redE{y}}{dt}
  • En notación vectorial v(t)=[x(t)y(t)]\vec{\textbf{v}}(t) = \left[\begin{array}{c} x(t) \\ y(t) \end{array} \right], la fórmula anterior tiene una expresión muy elegante usando el gradiente de ff y la derivada del vector v(t)\vec{\textbf{v}}(t).
ddtf(v(t))Derivada de la funcin composicinoˊoˊ=fv(t)Producto punto de vectores \underbrace{ \dfrac{d}{dt} f(\vec{\textbf{v}}(t)) }_{\text{Derivada de la función composición}} \!\!\!\!\!\! \!\!\!\!\!\! = \overbrace{ \nabla f \cdot \vec{\textbf{v}}'(t) }^{\text{Producto punto de vectores}}
Cargando