If you're seeing this message, it means we're having trouble loading external resources on our website.

Si estás detrás de un filtro de páginas web, por favor asegúrate de que los dominios *.kastatic.org y *.kasandbox.org estén desbloqueados.

Contenido principal

Las derivadas direccionales (a fondo)

Una visión más detallada de la fórmula de las derivadas direccionales, junto con una explicación de por qué el gradiente da la dirección del ascenso más pronunciado.

Antecedentes:

Este artículo va dirigido para aquellos que quieran una comprensión más profunda de la derivada direccional y de su fórmula.

La definición formal de la derivada direccional

Hay un par de razones por las que te podría importar una definición formal. Por un lado, entender realmente la definición formal de un nuevo concepto puede aclarar lo que realmente está sucediendo. Pero más importante que eso, creo que el beneficio principal es que te da la confianza de reconocer cuando puedes aplicar ese concepto y cuando no.
Como calentamiento, repasemos la definición formal de la derivada parcial, digamos con respecto a x:
start fraction, \partial, f, divided by, start color #0c7f99, \partial, x, end color #0c7f99, end fraction, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, equals, limit, start subscript, h, \to, 0, end subscript, start fraction, f, left parenthesis, x, start subscript, 0, end subscript, start color #0c7f99, plus, h, end color #0c7f99, comma, y, start subscript, 0, end subscript, right parenthesis, minus, f, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, divided by, start color #0c7f99, h, end color #0c7f99, end fraction
La conexión entre la manera informal de leer start fraction, \partial, f, divided by, \partial, x, end fraction y la manera formal de leer el lado derecho es la siguiente:
SímboloComprensión informal Comprensión formal
\partial, xUn pequeño desplazamiento en dirección x.Una variable infinitesimal h que tiende a 0 y que se le va a sumar a la primera componente de la entrada de la función.
\partial, fEl resultado del cambio en el valor de salida de f después del desplazamiento.La diferencia entre f, left parenthesis, x, start subscript, 0, end subscript, plus, h, comma, y, start subscript, 0, end subscript, right parenthesis y f, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, tomada en el mismo límite a medida que h, \to, 0.
En su lugar, podríamos escribir la definición en notación vectorial, al ver el punto de entrada left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis como el vector bidimensional
x0=[x0y0]\begin{aligned} \textbf{x}_0 = \left[ \begin{array}{c} x_0 \\\\ y_0 \\\\ \end{array} \right] \end{aligned}
Aquí, start bold text, x, end bold text, start subscript, 0, end subscript está en negritas para enfatizar que es un vector. Es un poco confuso usar la letra start bold text, x, end bold text en negritas para toda la entrada en vez de otra letra, pues ya estamos usando la letra x para denotar la primera componente de la entrada. Pero bueno, es una convención, así que la usaremos.
En vez de escribir el valor de entrada "desplazado" como left parenthesis, x, start subscript, 0, end subscript, plus, h, comma, y, start subscript, 0, end subscript, right parenthesis, lo escribimos como start bold text, x, end bold text, start subscript, 0, end subscript, plus, h, start bold text, i, end bold text, with, hat, on top, donde start bold text, i, end bold text, with, hat, on top es el vector unitario en la dirección x:
fx(x0)=limh0f(x0+hi^)f(x0)h\begin{aligned} \dfrac{\partial f}{\partial x}(\textbf{x}_0) = \lim_{h \to 0} \dfrac{f(\textbf{x}_0 + h \hat{\textbf{i}}) - f(\textbf{x}_0)}{h} \end{aligned}
Con esta notación, es mucho más fácil ver cómo generalizar la derivada parcial con respecto a x a la derivada direccional a lo largo de cualquier vector start bold text, v, end bold text, with, vector, on top:
start color #0c7f99, del, start subscript, start color #e84d39, start bold text, v, end bold text, with, vector, on top, end color #e84d39, end subscript, f, left parenthesis, start bold text, x, end bold text, start subscript, 0, end subscript, right parenthesis, equals, limit, start subscript, h, \to, 0, end subscript, start fraction, f, left parenthesis, start bold text, x, end bold text, start subscript, 0, end subscript, plus, h, start color #e84d39, start bold text, v, end bold text, with, vector, on top, end color #e84d39, right parenthesis, minus, f, left parenthesis, start bold text, x, end bold text, start subscript, 0, end subscript, right parenthesis, divided by, h, end fraction, end color #0c7f99
En este caso, sumarle h, start bold text, v, end bold text, with, vector, on top a la entrada para una variable infinitesimal h, \to, 0 formaliza la idea de un pequeño desplazamiento en la dirección de start bold text, v, end bold text, with, vector, on top.
Desplazamiento de la derivada direccional

Buscar la conexión entre la definición y el cálculo

Calcular la derivada direccional involucra el producto punto entre el gradiente del, f y el vector start bold text, v, end bold text, with, vector, on top. Por ejemplo, en dos dimensiones, esto se vería así:
vf(x,y)=fv=[fxfy][v1v2]=v1fx(x,y)+v2fy(x,y)\begin{aligned} \nabla_{\vec{\textbf{v}}} f(x, y) &= \nabla f \cdot \vec{\textbf{v}} \\\\ &= \left[ \begin{array}{c} \dfrac{\partial f}{\partial x} \\\\ \dfrac{\partial f}{\partial y} \end{array} \right] \cdot \left[ \begin{array}{c} \blueE{v_1} \\\\ \greenE{v_2} \end{array} \right] \\\\ &= \blueE{v_1} \dfrac{\partial f}{\partial x}(x, y) + \greenE{v_2} \dfrac{\partial f}{\partial y}(x, y) \end{aligned}
Aquí, start color #0c7f99, v, start subscript, 1, end subscript, end color #0c7f99 y start color #0d923f, v, start subscript, 2, end subscript, end color #0d923f son las componentes de start bold text, v, end bold text, with, vector, on top.
v=[v1v2]\begin{aligned} \vec{\textbf{v}} = \left[ \begin{array}{c} \blueE{v_1} \\ \\ \greenE{v_2} \\\\ \end{array} \right] \end{aligned}
La pregunta central es: ¿qué tiene que ver esta fórmula con la definición dada anteriormente?

Descomponer el desplazamiento

El cálculo de del, start subscript, start bold text, v, end bold text, end subscript, f se puede ver como una forma de descomponer un pequeño paso en la dirección de start bold text, v, end bold text en sus componentes x y y.
Separa un paso a lo largo del vector h, start bold text, v, end bold text, with, vector, on top en componentes
Específicamente, puedes imaginarte el siguiente procedimiento:
  1. Comienza en algún punto left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis.
  2. Escoge un valor pequeño de h.
  3. Suma h, start color #0c7f99, v, start subscript, 1, end subscript, end color #0c7f99 a x, start subscript, 0, end subscript, lo cual significa llegar al punto left parenthesis, x, start subscript, 0, end subscript, plus, h, start color #0c7f99, v, start subscript, 1, end subscript, end color #0c7f99, comma, y, start subscript, 0, end subscript, right parenthesis. De lo que sabemos de las derivadas parciales, esto cambiará el valor de salida de la función por aproximadamente
hv1(fx(x0,y0))\begin{aligned} h\blueE{v_1} \left(\dfrac{\partial f}{\partial x}(x_0, y_0) \right) \end{aligned}
  • Ahora suma h, start color #0d923f, v, start subscript, 2, end subscript, end color #0d923f a y, start subscript, 0, end subscript para llegar arriba/abajo del punto left parenthesis, x, start subscript, 0, end subscript, plus, h, start color #0c7f99, v, start subscript, 1, end subscript, end color #0c7f99, comma, y, start subscript, 0, end subscript, plus, h, start color #0d923f, v, start subscript, 2, end subscript, end color #0d923f, right parenthesis. El cambio resultante de f ahora es aproximadamente
hv2(fy(x0+hv1,y0))\begin{aligned} h\greenE{v_2}\left( \dfrac{\partial f}{\partial y}(x_0 + h\blueE{v_1}, y_0) \right) \end{aligned}
Al sumar los resultados de los pasos 3 y 4, el cambio total de la función que resultó de ir de la entrada left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis a la entrada left parenthesis, x, start subscript, 0, end subscript, plus, h, start color #0c7f99, v, start subscript, 1, end subscript, end color #0c7f99, comma, y, start subscript, 0, end subscript, plus, h, start color #0d923f, v, start subscript, 2, end subscript, end color #0d923f, right parenthesis fue de aproximadamente
hv1(fx(x0,y0))+hv2(fy(x0+hv1,y0))\begin{aligned} h\blueE{v_1} \left(\dfrac{\partial f}{\partial x}(x_0, y_0) \right) + h\greenE{v_2}\left( \dfrac{\partial f}{\partial y}(x_0 \redD{+ h\blueE{v_1}}, y_0) \right) \end{aligned}
Este resultado es muy cercano a la expresión de la derivada direccional, que dice que el cambio en f debido a este paso h, start bold text, v, end bold text, with, vector, on top debe ser de aproximadamente
=hvf(x0,y0)=hvf(x0,y0)=hv1fx(x0,y0)+hv2fy(x0,y0)\begin{aligned} &\phantom{=}h \nabla_{\vec{\textbf{v}}} f(x_0, y_0) \\\\ &= h \vec{\textbf{v}} \cdot \nabla f(x_0, y_0)\\\\ &= h\blueE{v_1}\dfrac{\partial f}{\partial x}(x_0, y_0) + h\greenE{v_2}\dfrac{\partial f}{\partial y}(x_0, y_0) \end{aligned}
Sin embargo, esto difiere ligeramente del resultado de nuestra argumentación que hicimos paso a paso, en la cual se toma la derivada parcial con respecto a y en el punto left parenthesis, x, start subscript, 0, end subscript, plus, h, start color #0c7f99, v, start subscript, 1, end subscript, end color #0c7f99, comma, y, start subscript, 0, end subscript, right parenthesis, no en el punto left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis.
Afortunadamente estamos considerando valores muy, muy pequeños de h. De hecho, técnicamente deberíamos de hablar del límite conforme h, \to, 0. Por lo tanto, evaluar start fraction, \partial, f, divided by, \partial, y, end fraction en el punto left parenthesis, x, start subscript, 0, end subscript, plus, h, start color #0c7f99, v, start subscript, 1, end subscript, end color #0c7f99, comma, y, start subscript, 0, end subscript, right parenthesis será casi lo mismo que evaluarla en left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis. Además, conforme h tiende a 0, también lo hace la diferencia entre estos dos puntos, pero debemos suponer que f es continua.

¿Por qué el gradiente apunta en la dirección del ascenso más pronunciado?

Una vez que ya aprendimos acerca de las derivadas direccionales, ahora podemos entender por qué la dirección del gradiente es la del ascenso más pronunciado.
El concepto del ascenso más pronunciado.
Específicamente, esta es la pregunta en cuestión.
Escenario:
  • Sea f una función escalar multivariable, como f, left parenthesis, x, comma, y, right parenthesis, equals, x, squared, plus, y, squared.
  • Sea left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis un punto de entrada particular.
  • Considera todas las posibles direcciones, es decir, todos los vectores unitarios start bold text, u, end bold text, with, hat, on top en el espacio de entradas de f.
Pregunta (informal): si comenzamos en left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis, ¿en cuál dirección debemos caminar de modo que la salida de f se incremente más rápidamente?
Pregunta (formal): ¿cuál vector unitario start bold text, u, end bold text, with, hat, on top maximiza la derivada direccional a lo largo de start bold text, u, end bold text, with, hat, on top?
u^f(x0,y0)=u^f(x0,y0)Maximiza esta cantidad\begin{aligned} \nabla_{\hat{\textbf{u}}} f(x_0, y_0) = \underbrace{\hat{\textbf{u}} \cdot \nabla f(x_0, y_0)}_{ \text{Maximiza esta cantidad} } \end{aligned}
La famosa desigualdad del triángulo nos dice que esta derivada será maximizada por el vector unitario en la dirección de del, f, left parenthesis, x, start subscript, 0, end subscript, comma, y, start subscript, 0, end subscript, right parenthesis.
Maximiza el producto punto
Observa que el hecho de que el gradiente apunte en la dirección del ascenso más pronunciado es una consecuencia del hecho más fundamental de que todas las derivada direccionales requieren tomar el producto punto con del, f.

¿Quieres unirte a la conversación?

¿Sabes inglés? Haz clic aquí para ver más discusiones en el sitio en inglés de Khan Academy.