Différentielle

Apparence déplacer vers la barre latérale masquer

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources (décembre 2019).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?

En analyse fonctionnelle et vectorielle, on appelle différentielle d'ordre 1 d'une fonction en un point a {\displaystyle a} $a$ (ou dérivée de cette fonction au point a {\displaystyle a} $a$ ) la partie linéaire de l'accroissement de cette fonction entre a {\displaystyle a} $a$ et a + h {\displaystyle a+h} $a+h$ lorsque h {\displaystyle h} $h$ tend vers 0. Elle généralise aux fonctions de plusieurs variables la notion de nombre dérivé d'une fonction d'une variable réelle, et permet ainsi d'étendre celle de développements limités. Cette différentielle n'existe pas toujours, et une fonction possédant une différentielle en un point est dite différentiable en ce point. On peut ensuite calculer des différentielles d'ordre supérieur à 1.

On utilise la notation différentielle avec beaucoup d'efficacité dans le cadre du calcul d'approximations et du calcul de dérivées. Elle facilite la formule de la dérivée de la composée. Elle se révèle très pratique dans le changement de variable en calcul intégral.

Dans l'approche de Leibniz, la différentielle d'une fonction est son « accroissement infinitésimal », qui s'écrit comme une combinaison des accroissements infinitésimaux des différentes variables. Ainsi pour une fonction f {\displaystyle f} $f$ des variables x {\displaystyle x} $x$ et y {\displaystyle y} $y$ , l'accroissement infinitésimal d f {\displaystyle \mathrm {d} f} $\mathrm {d} f$ s'exprime sous la forme :

d f = ∂ f ∂ x d x + ∂ f ∂ y d y = p d x + q d y {\displaystyle \mathrm {d} f={\frac {\partial f}{\partial x}}\,\mathrm {d} x+{\frac {\partial f}{\partial y}}\,\mathrm {d} y=p\,\mathrm {d} x+q\,\mathrm {d} y}

\mathrm {d} f={\frac {\partial f}{\partial x}}\,\mathrm {d} x+{\frac {\partial f}{\partial y}}\,\mathrm {d} y=p\,\mathrm {d} x+q\,\mathrm {d} y

où ∂ f ∂ x {\displaystyle {\frac {\partial f}{\partial x}}} ${\frac {\partial f}{\partial x}}$ et ∂ f ∂ y {\displaystyle {\frac {\partial f}{\partial y}}} ${\frac {\partial f}{\partial y}}$ sont les dérivées partielles de f {\displaystyle f} $f$ .

Le calcul différentiel ainsi conçu, s'il était un outil de calcul efficace, manquait d'un fondement rigoureux, en particulier en ce qui concerne la notion de quantité infinitésimale. La notion moderne de différentielle est l'outil algébrique qui permet de passer des accroissements finis δ x {\displaystyle \delta x} $\delta x$ , δ y {\displaystyle \delta y} $\delta y$ des variables à l'accroissement δ f {\displaystyle \delta f} $\delta f$ de la fonction, en se limitant au premier ordre d'approximation. Mathématiquement, il n'est plus question de petite variation mais de calcul au premier ordre, dont la définition s'exprime sous forme d'une limite.

Il convient cependant de ne pas négliger la puissance d'évocation et l'efficacité dans les calculs du point de vue original de Leibniz. C'est ce qui explique qu'il reste massivement utilisé, notamment par les physiciens ou les économistes. En introduisant la notion avancée de calcul tensoriel sur les variétés, les mathématiciens ont pu assurer un statut précis aux notations différentielles de tous ordres.

Première approche

Fonction d'une seule variable

Le calcul différentiel, pour les fonctions d'une seule variable, se confond avec la dérivation. Soit f {\displaystyle f} $f$ une fonction d'une variable réelle, à valeurs réelles ; on notera y = f ( x ) {\displaystyle y=f(x)} $y=f(x)$ le résultat de l'application de f {\displaystyle f} $f$ . Elle est dite dérivable en a {\displaystyle a} $a$ lorsqu'il existe un réel, noté f ′ ( a ) {\displaystyle f'(a)} $f'(a)$ , tel que pour tout réel h {\displaystyle h} $h$ on ait :

f ( a + h ) = f ( a ) + f ′ ( a ) h + h ε ( h ) {\displaystyle f(a+h)=f(a)+f'(a)\,h+h\,\varepsilon (h)}

f(a+h)=f(a)+f'(a)\,h+h\,\varepsilon (h)

où ε {\displaystyle \varepsilon } $\varepsilon$ est une fonction ayant une limite nulle en 0. f ′ ( a ) {\displaystyle f'(a)} $f'(a)$ est alors appelé nombre dérivé de f {\displaystyle f} $f$ en a {\displaystyle a} $a$ . On résume souvent cela par la notation (dite notation de Landau) :

f ( a + h ) = f ( a ) + f ′ ( a ) h + o ( h ) . {\displaystyle f(a+h)=f(a)+f'(a)\,h+o(h).}

f(a+h)=f(a)+f'(a)\,h+o(h).

Intuitivement ce calcul de limite, qui porte le nom de développement limité à l'ordre 1 pour la fonction f {\displaystyle f} $f$ en a {\displaystyle a} $a$ , signifie qu'en première approximation, pour h {\displaystyle h} $h$ proche de 0, la valeur de f ( a + h ) {\displaystyle f(a+h)} $f(a+h)$ est peu différente de celle de f ( a ) + f ′ ( a ) ⋅ h {\displaystyle f(a)+f'(a)\cdot h} $f(a)+f'(a)\cdot h$ . Notamment parmi les expressions affines (c'est-à-dire de la forme α + β ⋅ h {\displaystyle \alpha +\beta \cdot h} $\alpha +\beta \cdot h$ ), c'est celle-ci qui donne la meilleure approximation de f ( a + h ) {\displaystyle f(a+h)} $f(a+h)$ .

Introduction intuitive des notations du calcul infinitésimal

Dans de nombreuses applications, des notations parlantes sont employées pour décrire cette situation. On convient de noter le nombre h {\displaystyle h} $h$ par d x {\displaystyle \mathrm {d} x} $\mathrm {d} x$ pour indiquer qu'il représente une très petite variation de x {\displaystyle x} $x$ par rapport à la valeur de référence a {\displaystyle a} $a$ . On note d y {\displaystyle \mathrm {d} y} $\mathrm {d} y$ la variation de l'image par rapport à la valeur de référence :

d y = f ( a + h ) − f ( a ) ≃ f ′ ( a ) d x . {\displaystyle \mathrm {d} y=f(a+h)-f(a)\simeq f'(a)\,\mathrm {d} x.}

\mathrm {d} y=f(a+h)-f(a)\simeq f'(a)\,\mathrm {d} x.

Le point de vue couramment adopté (surtout en physique), abusif en toute rigueur, est que pour des variations suffisamment petites, on peut écrire d y = f ′ ( a ) d x {\displaystyle \mathrm {d} y=f'(a)\,\mathrm {d} x} $\mathrm {d} y=f'(a)\,\mathrm {d} x$ . Cette présentation escamote en effet la nécessité d'utiliser un calcul de limite, car même pour des variations très petites, le terme d'erreur noté o ( h ) {\displaystyle o(h)} $o(h)$ ci-dessus n'a pas de raison d'être nul. Mathématiquement parlant, il serait plus juste de noter cela :

δ y ≃ f ′ ( a ) δ x {\displaystyle \delta y\simeq f'(a)\,\delta x}

\delta y\simeq f'(a)\,\delta x

car les mathématiciens prouvent la formule exacte d y = f ′ ( a ) d x {\displaystyle \mathrm {d} y=f'(a)\,\mathrm {d} x} $\mathrm {d} y=f'(a)\,\mathrm {d} x$ , en donnant aux notations d x {\displaystyle \mathrm {d} x} $\mathrm {d} x$ et d y {\displaystyle \mathrm {d} y} $\mathrm {d} y$ un sens précis qui n'est pas celui de petites variations et qui sera détaillé plus bas.

Fonction de deux variables

Soit f {\displaystyle f} $f$ une fonction des deux variables x {\displaystyle x} $x$ et y {\displaystyle y} $y$ ; on notera z = f ( x , y ) {\displaystyle z=f(x,y)} $z=f(x,y)$ le résultat de l'application de f {\displaystyle f} $f$ .

Valeur attendue pour la différentielle

De nouveau, la question posée peut être formulée ainsi : lorsque, par rapport à des valeurs de référence a {\displaystyle a} $a$ et b {\displaystyle b} $b$ , on augmente les variables x {\displaystyle x} $x$ et y {\displaystyle y} $y$ des quantités d x {\displaystyle \mathrm {d} x} $\mathrm {d} x$ et d y {\displaystyle \mathrm {d} y} $\mathrm {d} y$ , quel est l'effet (au premier ordre) sur la variable z {\displaystyle z} $z$ ?

Les dérivées partielles permettent de répondre à la question lorsqu'une des deux variations est nulle. Ainsi, parce que c'est un simple calcul de dérivée de fonction d'une variable, il est possible d'écrire :

d z a , b = d f a , b = ∂ f ∂ x ( a , b ) d x {\displaystyle \mathrm {d} z_{a,b}=\mathrm {d} f_{a,b}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x}

\mathrm {d} z_{a,b}=\mathrm {d} f_{a,b}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x

lorsque d y = 0 {\displaystyle \mathrm {d} y=0}

\mathrm {d} y=0

et de même en inversant les rôles : si d x {\displaystyle \mathrm {d} x} $\mathrm {d} x$ est nul, d z {\displaystyle \mathrm {d} z} $\mathrm {d} z$ se calcule à l'aide de la deuxième dérivée partielle.

Il semblerait naturel que lorsqu'on augmente x {\displaystyle x} $x$ et y {\displaystyle y} $y$ respectivement des quantités infiniment petites d x {\displaystyle \mathrm {d} x} $\mathrm {d} x$ et d y {\displaystyle \mathrm {d} y} $\mathrm {d} y$ , l'augmentation totale soit obtenue en superposant les deux cas précédents :

d z a , b = d f a , b = ∂ f ∂ x ( a , b ) d x + ∂ f ∂ y ( a , b ) d y {\displaystyle \mathrm {d} z_{a,b}=\mathrm {d} f_{a,b}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x+{\frac {\partial f}{\partial y}}(a,b)\,\mathrm {d} y}

\mathrm {d} z_{a,b}=\mathrm {d} f_{a,b}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x+{\frac {\partial f}{\partial y}}(a,b)\,\mathrm {d} y

ce qu'en physique on énonce en général sous la forme : la différentielle « totale » est la somme des « différentielles partielles ».

On écrira par exemple : si z = x 2 + x y {\displaystyle z=x^{2}+xy} $z=x^{2}+xy$ alors d z = d f = ( 2 x + y ) d x + x d y {\displaystyle \mathrm {d} z=\mathrm {d} f=(2x+y)\,\mathrm {d} x+x\,\mathrm {d} y} $\mathrm {d} z=\mathrm {d} f=(2x+y)\,\mathrm {d} x+x\,\mathrm {d} y$ . De fait, cette formule sera vérifiée dans de très nombreux calculs explicites ; mais elle n'est pas vraie en toute généralité.

Le problème de la différentiabilité

Il faut détailler le raisonnement pour voir où il pèche. On peut faire subir d'abord une augmentation de d x {\displaystyle \mathrm {d} x} $\mathrm {d} x$ à la seule variable x {\displaystyle x} $x$ , ce qui la fait passer de la valeur a {\displaystyle a} $a$ à a + d x {\displaystyle a+\mathrm {d} x} $a+\mathrm {d} x$ , tandis que y {\displaystyle y} $y$ reste égal à b {\displaystyle b} $b$ . Puis, en maintenant x = a + d x {\displaystyle x=a+\mathrm {d} x} $x=a+\mathrm {d} x$ constant, on fait passer y {\displaystyle y} $y$ de b {\displaystyle b} $b$ à b + d y {\displaystyle b+\mathrm {d} y} $b+\mathrm {d} y$ . Les accroissements de z {\displaystyle z} $z$ résultants sont donc plus précisément :

d z 1 = ∂ f ∂ x ( a , b ) d x {\displaystyle \mathrm {d} z_{1}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x}

\mathrm {d} z_{1}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x

et d z 2 = ∂ f ∂ y ( a + d x , b ) d y {\displaystyle \mathrm {d} z_{2}={\frac {\partial f}{\partial y}}(a+\mathrm {d} x,b)\,\mathrm {d} y}

\mathrm {d} z_{2}={\frac {\partial f}{\partial y}}(a+\mathrm {d} x,b)\,\mathrm {d} y

et encore si cette deuxième quantité existe effectivement.

L'existence de dérivées partielles au seul point ( a , b ) {\displaystyle (a,b)} $(a,b)$ est a priori insuffisant pour écrire une formule générale de calcul de d z {\displaystyle \mathrm {d} z} $\mathrm {d} z$ . En revanche, si l'on suppose que les dérivées partielles sont définies et continues sur un voisinage de ( a , b ) {\displaystyle (a,b)} $(a,b)$ , on pourra effectivement affirmer que d z {\displaystyle \mathrm {d} z} $\mathrm {d} z$ a la valeur attendue.

Définition de la différentielle

En termes généraux, la différentiabilité est l'existence d'un développement limité à l'ordre 1 en un point, et la différentielle est la partie d'ordre 1 (donc linéaire) exactement.

Pour une fonction réelle à deux variables

Étudions en premier lieu une fonction de deux variables, à valeurs réelles : on notera z = f ( x , y ) {\displaystyle z=f(x,y)} $z=f(x,y)$ . Cette fonction sera dite différentiable au point m {\displaystyle m} $m$ de coordonnées ( x , y ) {\displaystyle (x,y)} $(x,y)$ s'il existe une formule de développement limité d'ordre 1 pour la fonction en ce point, c'est-à-dire :

f ( x + h 1 , y + h 2 ) = f ( x , y ) + α h 1 + β h 2 + o ( h 1 2 + h 2 2 ) {\displaystyle f(x+h_{1},y+h_{2})=f(x,y)+\alpha \,h_{1}+\beta \,h_{2}+o\left({\sqrt {{h_{1}}^{2}+{h_{2}}^{2}}}\right)}

f(x+h_{1},y+h_{2})=f(x,y)+\alpha \,h_{1}+\beta \,h_{2}+o\left({\sqrt {{h_{1}}^{2}+{h_{2}}^{2}}}\right)

avec α {\displaystyle \alpha } $\alpha$ et β {\displaystyle \beta } $\beta$ des coefficients réels, ou encore :

lim ( h 1 , h 2 ) → ( 0 , 0 ) f ( x + h 1 , y + h 2 ) − f ( x , y ) − α h 1 − β h 2 h 1 2 + h 2 2 = 0 {\displaystyle \lim _{(h_{1},h_{2})\to (0,0)}{\frac {f(x+h_{1},y+h_{2})-f(x,y)-\alpha h_{1}-\beta h_{2}}{\sqrt {{h_{1}}^{2}+{h_{2}}^{2}}}}=0}

\lim _{(h_{1},h_{2})\to (0,0)}{\frac {f(x+h_{1},y+h_{2})-f(x,y)-\alpha h_{1}-\beta h_{2}}{\sqrt {{h_{1}}^{2}+{h_{2}}^{2}}}}=0

La limite est à prendre au sens des limites de fonctions de deux variables.

Si la fonction est différentiable, on montre que les coefficients α {\displaystyle \alpha } $\alpha$ et β {\displaystyle \beta } $\beta$ sont bien les dérivées partielles de f {\displaystyle f} $f$ . On peut alors écrire :

f ( x + h 1 , y + h 2 ) = f ( m + h → ) = f ( m ) + L ( h → ) + o ( ‖ h → ‖ ) {\displaystyle f(x+h_{1},y+h_{2})=f(m+{\vec {h}})=f(m)+L({\vec {h}})+o(\|{\vec {h}}\|)}

f(x+h_{1},y+h_{2})=f(m+{\vec {h}})=f(m)+L({\vec {h}})+o(\|{\vec {h}}\|)

avec l'expression suivante qui est linéaire en h → = ( h 1 , h 2 ) {\displaystyle {\vec {h}}=(h_{1},h_{2})} ${\vec {h}}=(h_{1},h_{2})$

L ( h → ) = ∂ f ∂ x ( x , y ) h 1 + ∂ f ∂ y ( x , y ) h 2 . {\displaystyle L({\vec {h}})={\frac {\partial f}{\partial x}}(x,y)\,h_{1}+{\frac {\partial f}{\partial y}}(x,y)\,h_{2}.}

L({\vec {h}})={\frac {\partial f}{\partial x}}(x,y)\,h_{1}+{\frac {\partial f}{\partial y}}(x,y)\,h_{2}.

L'application linéaire L {\displaystyle L} $L$ est appelée différentielle de f {\displaystyle f} $f$ au point m {\displaystyle m} $m$ et peut se noter d f ( m ) {\displaystyle \mathrm {d} f(m)} $\mathrm {d} f(m)$ ou bien d f m {\displaystyle \mathrm {d} f_{m}} $\mathrm {d} f_{m}$ .

On peut reprendre l'interprétation intuitive de L {\displaystyle L} $L$ . Si les variables subissent une petite modification δ ℓ → {\displaystyle \delta {\vec {\ell }}} $\delta {\vec {\ell }}$ , l'effet sur la fonction est une modification δ f = L ( δ ℓ → ) {\displaystyle \delta f=L(\delta {\vec {\ell }})} $\delta f=L(\delta {\vec {\ell }})$ , à condition de s'empresser d'ajouter : « du moins au premier ordre ».

Généralisations en dimension finie

Cette première notion se généralise aux fonctions de R n {\displaystyle \mathbb {R} ^{n}} $\mathbb {R} ^{n}$ dans R {\displaystyle \mathbb {R} } $\mathbb {R}$ , en changeant simplement le nombre de variables, puis aux fonctions de R n {\displaystyle \mathbb {R} ^{n}} $\mathbb {R} ^{n}$ dans R p {\displaystyle \mathbb {R} ^{p}} $\mathbb {R} ^{p}$ en admettant des coefficients vectoriels pour le développement limité. Une fonction f → {\displaystyle {\vec {f}}} ${\vec {f}}$ de R n {\displaystyle \mathbb {R} ^{n}} $\mathbb {R} ^{n}$ dans R p {\displaystyle \mathbb {R} ^{p}} $\mathbb {R} ^{p}$ sera dite différentiable en a {\displaystyle a} $a$ s'il existe un développement de la forme :

f → ( a 1 + h 1 , … , a n + h n ) = f → ( a 1 , … , a n ) + h 1 α 1 → + ⋯ + h n α n → + o ( ‖ h → ‖ ) {\displaystyle {\vec {f}}(a_{1}+h_{1},\dots ,a_{n}+h_{n})={\vec {f}}(a_{1},\dots ,a_{n})+h_{1}\,{\vec {\alpha _{1}}}+\dots +h_{n}\,{\vec {\alpha _{n}}}+o\left(\|{\vec {h}}\|\right)}

{\vec {f}}(a_{1}+h_{1},\dots ,a_{n}+h_{n})={\vec {f}}(a_{1},\dots ,a_{n})+h_{1}\,{\vec {\alpha _{1}}}+\dots +h_{n}\,{\vec {\alpha _{n}}}+o\left(\|{\vec {h}}\|\right)

avec ‖ h → ‖ {\displaystyle \|{\vec {h}}\|} $\|{\vec {h}}\|$ qui désigne la norme du vecteur de composantes ( h 1 , . . . , h n ) {\displaystyle (h_{1},...,h_{n})} $(h_{1},...,h_{n})$ . Cette condition peut aussi s'écrire comme :

lim h → → 0 → f → ( a 1 + h 1 , … , a n + h n ) − f → ( a 1 , … , a n ) − h 1 α 1 → − ⋯ − h n α n → ‖ h → ‖ = 0 → {\displaystyle \lim _{{\vec {h}}\to {\vec {0}}}{\frac {{\vec {f}}(a_{1}+h_{1},\dots ,a_{n}+h_{n})-{\vec {f}}(a_{1},\dots ,a_{n})-h_{1}\,{\vec {\alpha _{1}}}-\dots -h_{n}\,{\vec {\alpha _{n}}}}{\|{\vec {h}}\|}}={\vec {0}}}

\lim _{{\vec {h}}\to {\vec {0}}}{\frac {{\vec {f}}(a_{1}+h_{1},\dots ,a_{n}+h_{n})-{\vec {f}}(a_{1},\dots ,a_{n})-h_{1}\,{\vec {\alpha _{1}}}-\dots -h_{n}\,{\vec {\alpha _{n}}}}{\|{\vec {h}}\|}}={\vec {0}}

La limite est à prendre au sens des limites de fonctions de n {\displaystyle n} $n$ variables. De nouveau, si la fonction est différentiable, on montre que les coefficients { α i → } i = 1 , … , n {\displaystyle \{{\vec {\alpha _{i}}}\}_{i=1,\dots ,n}} $\{{\vec {\alpha _{i}}}\}_{i=1,\dots ,n}$ apparaissant dans ce développement sont les dérivées partielles de f → {\displaystyle {\vec {f}}} ${\vec {f}}$ . On notera donc :

d f → ( a ) ( h → ) = ∂ f → ∂ x 1 ( a ) h 1 + ⋯ + ∂ f → ∂ x n ( a ) h n {\displaystyle \mathrm {d} {\vec {f}}(a)({\vec {h}})={\frac {\partial {\vec {f}}}{\partial x_{1}}}(a)\,h_{1}+\dots +{\frac {\partial {\vec {f}}}{\partial x_{n}}}(a)\,h_{n}}

\mathrm {d} {\vec {f}}(a)({\vec {h}})={\frac {\partial {\vec {f}}}{\partial x_{1}}}(a)\,h_{1}+\dots +{\frac {\partial {\vec {f}}}{\partial x_{n}}}(a)\,h_{n}

Pour effectuer ce calcul il est judicieux d'introduire des représentations matricielles pour le vecteur h → {\displaystyle {\vec {h}}} ${\vec {h}}$ et l'application linéaire d f → ( a ) {\displaystyle \mathrm {d} {\vec {f}}(a)} $\mathrm {d} {\vec {f}}(a)$ : c'est ce que l'on appelle la matrice jacobienne de l'application. C'est une matrice de dimension ( p , n ) {\displaystyle (p,n)} $(p,n)$ . Le calcul de d f → ( a ) ( h → ) {\displaystyle \mathrm {d} {\vec {f}}(a)({\vec {h}})} $\mathrm {d} {\vec {f}}(a)({\vec {h}})$ peut aussi être présenté comme un calcul de produit scalaire du vecteur h → {\displaystyle {\vec {h}}} ${\vec {h}}$ avec le vecteur gradient de f {\displaystyle f} $f$ au point a {\displaystyle a} $a$ .

La différentiabilité de la fonction assure l'existence de dérivées partielles ; la réciproque est fausse : l'existence de dérivées partielles n'assure pas la différentiabilité de la fonction, ni même sa continuité.

Il existe cependant un résultat positif : si les dérivées partielles de f {\displaystyle f} $f$ existent et sont continues, alors f {\displaystyle f} $f$ est différentiable.

Si l'application f {\displaystyle f} $f$ est linéaire, alors elle est différentiable en tout point a {\displaystyle a} $a$ et d f ( a ) = f {\displaystyle \mathrm {d} f(a)=f} $\mathrm {d} f(a)=f$ . Ceci s'applique en particulier à chaque fonction coordonnée R n → R {\displaystyle \mathbb {R} ^{n}\to \mathbb {R} } $\mathbb {R} ^{n}\to \mathbb {R}$ , x → x k {\displaystyle x\to x_{k}} $x\to x_{k}$ — dont la dérivée en tout point a {\displaystyle a} $a$ , d x k ( a ) : h → h k {\displaystyle \mathrm {d} x_{k}(a)\,:\,h\to h_{k}} $\mathrm {d} x_{k}(a)\,:\,h\to h_{k}$ , est simplement notée d x k {\displaystyle \mathrm {d} x_{k}} $\mathrm {d} x_{k}$ — et justifie la réécriture suivante de la différentielle de f → {\displaystyle {\vec {f}}} ${\vec {f}}$ en a {\displaystyle a} $a$ :

d f → ( a ) = ∂ f → ∂ x 1 ( a ) d x 1 + ⋯ + ∂ f → ∂ x n ( a ) d x n {\displaystyle \mathrm {d} {\vec {f}}(a)={\frac {\partial {\vec {f}}}{\partial x_{1}}}(a)\,\mathrm {d} x_{1}+\dots +{\frac {\partial {\vec {f}}}{\partial x_{n}}}(a)\,\mathrm {d} x_{n}}

\mathrm {d} {\vec {f}}(a)={\frac {\partial {\vec {f}}}{\partial x_{1}}}(a)\,\mathrm {d} x_{1}+\dots +{\frac {\partial {\vec {f}}}{\partial x_{n}}}(a)\,\mathrm {d} x_{n}

Applications au calcul infinitésimal

En calcul infinitésimal, l'habitude est de noter d f {\displaystyle \mathrm {d} f} $\mathrm {d} f$ des variations infinitésimales d'une fonction f {\displaystyle f} $f$ . Ainsi, soient f {\displaystyle f} $f$ , une fonction de x → = ( x 1 , … , x n ) {\displaystyle {\vec {x}}=(x_{1},\dots ,x_{n})} ${\vec {x}}=(x_{1},\dots ,x_{n})$ et d x → = ( d x 1 , … , d x n ) {\displaystyle \mathrm {d} {\vec {x}}=(\mathrm {d} x_{1},\dots ,\mathrm {d} x_{n})} $\mathrm {d} {\vec {x}}=(\mathrm {d} x_{1},\dots ,\mathrm {d} x_{n})$ où les d x i {\displaystyle \mathrm {d} x_{i}} $\mathrm {d} x_{i}$ sont les composantes d'une variation infinitésimale de x → {\displaystyle {\vec {x}}} ${\vec {x}}$ , alors la différentielle de f {\displaystyle f} $f$ au point x → {\displaystyle {\vec {x}}} ${\vec {x}}$ définit les variations infinitésimales de f {\displaystyle f} $f$ correspondant aux variations infinitésimales de x → {\displaystyle {\vec {x}}} ${\vec {x}}$ et s'écrit :

d f ( x → ) = ∑ i ∂ f ( x → ) ∂ x i d x i {\displaystyle \mathrm {d} f({\vec {x}})=\sum _{i}{\frac {\partial f({\vec {x}})}{\partial x_{i}}}\,\mathrm {d} x_{i}}

\mathrm {d} f({\vec {x}})=\sum _{i}{\frac {\partial f({\vec {x}})}{\partial x_{i}}}\,\mathrm {d} x_{i}

ou, en notation tensorielle avec la convention de sommation d'Einstein :

d f ( x → ) = ∂ f ( x → ) ∂ x i d x i {\displaystyle \mathrm {d} f({\vec {x}})={\frac {\partial f({\vec {x}})}{\partial x_{i}}}\,\mathrm {d} x_{i}}

\mathrm {d} f({\vec {x}})={\frac {\partial f({\vec {x}})}{\partial x_{i}}}\,\mathrm {d} x_{i}

Pour bien comprendre cette formule, il faut comprendre que l'accroissement infinitésimal ∂ f {\displaystyle \partial f} $\partial f$ est lié aux accroissements infinitésimaux ∂ x i {\displaystyle \partial x_{i}} $\partial x_{i}$ par les dérivées partielles qui sont indépendantes les unes des autres, et que par contre, on calcule la relation entre d f ( x → ) {\displaystyle \mathrm {d} f({\vec {x}})} $\mathrm {d} f({\vec {x}})$ et les d x i {\displaystyle \mathrm {d} x_{i}} $\mathrm {d} x_{i}$ qui sont, eux, liés entre eux par la direction dans laquelle on fait varier x → {\displaystyle {\vec {x}}} ${\vec {x}}$ .

Différentiabilité au sens de Fréchet

Plus généralement, il est possible de définir la notion de différentiabilité et de différentielle sans avoir recours à des bases.

Soient E {\displaystyle E} $E$ un espace vectoriel normé, F {\displaystyle F} $F$ un espace vectoriel topologique séparé, f {\displaystyle f} $f$ une application de E {\displaystyle E} $E$ dans F {\displaystyle F} $F$ et a {\displaystyle a} $a$ un point de E {\displaystyle E} $E$ . On abandonne la notation des vecteurs par des flèches dans ce paragraphe.

On dit que f {\displaystyle f} $f$ est différentiable en a {\displaystyle a} $a$ (au sens de Fréchet) s'il existe une application linéaire continue L : E → F {\displaystyle L:E\to F} $L:E\to F$ telle que :

∀ h ∈ E f ( a + h ) = f ( a ) + L ( h ) + o ( ‖ h ‖ ) {\displaystyle \forall h\in E\quad f(a+h)=f(a)+L(h)+o\left(\|h\|\right)}

\forall h\in E\quad f(a+h)=f(a)+L(h)+o\left(\|h\|\right)

ou, de manière équivalente :

lim h → 0 f ( a + h ) − f ( a ) − L ( h ) ‖ h ‖ = 0. {\displaystyle \lim _{h\to 0}{\frac {f(a+h)-f(a)-L(h)}{\|h\|}}=0.}

\lim _{h\to 0}{\frac {f(a+h)-f(a)-L(h)}{\|h\|}}=0.

Une telle application linéaire L {\displaystyle L} $L$ est alors unique. Elle est appelée différentielle de f {\displaystyle f} $f$ en a {\displaystyle a} $a$ et se note L = d f ( a ) {\displaystyle L=\mathrm {d} f(a)} $L=\mathrm {d} f(a)$ . De plus, sa continuité assure la continuité en a {\displaystyle a} $a$ de f {\displaystyle f} $f$ .

La différentiabilité dépend de la norme choisie sur E {\displaystyle E} $E$ ; on retrouve, cela dit, la définition usuelle en dimension finie (voir supra) puisque toutes les normes y sont équivalentes. Notons que pour h ∈ E {\displaystyle h\in E} $h\in E$ fixé, l'application D f ( . ) ( h ) : E → F : a ↦ d f ( a ) ( h ) {\displaystyle Df(.)(h):E\to F:a\mapsto \mathrm {d} f(a)(h)} $Df(.)(h):E\to F:a\mapsto \mathrm {d} f(a)(h)$ n'a aucune raison d'être linéaire. Par exemple pour E = F = R {\displaystyle E=F=\mathbb {R} } $E=F=\mathbb {R}$ , f = sin {\displaystyle f=\sin } $f=\sin$ et h = 1 {\displaystyle h=1} $h=1$ , on a D f ( . ) ( h ) = cos {\displaystyle Df(.)(h)=\cos } $Df(.)(h)=\cos$ .

On peut remarquer le changement sémantique entre la première définition, celle de Leibniz – un accroissement très petit –, et celle formalisée de nos jours – une application linéaire. Ce changement est l'aboutissement d'une évolution de plus de trois siècles entre une idée intuitive du calcul infinitésimal et sa formalisation.

Différentielle d'une fonction composée

Article détaillé : Différentielle d'une fonction composée.

La différentielle d'une fonction composée est donnée (sous de bonnes hypothèses) par, :

d ( g ∘ f ) ( a ) = d g ( f ( a ) ) ∘ d f ( a ) {\displaystyle \mathrm {d} (g\circ f)(a)=\mathrm {d} g(f(a))\circ \mathrm {d} f(a)}

\mathrm {d} (g\circ f)(a)=\mathrm {d} g(f(a))\circ \mathrm {d} f(a)

Différentielle d'ordre supérieur

Cas de la fonction réelle

Si y = f ( x ) {\displaystyle y=f(x)} $y=f(x)$ , si f {\displaystyle f} $f$ est dérivable sur I {\displaystyle I} $I$ , alors d f = f ′ ( x ) d x {\displaystyle \mathrm {d} f=f'(x)\,\mathrm {d} x} $\mathrm {d} f=f'(x)\,\mathrm {d} x$ . Si de plus, f ′ {\displaystyle f'} $f'$ est dérivable, d f {\displaystyle \mathrm {d} f} $\mathrm {d} f$ est différentiable et :

d 2 f = f ″ ( x ) d x d x {\displaystyle \mathrm {d} ^{2}f=f''(x)\,\mathrm {d} x\,\mathrm {d} x}

\mathrm {d} ^{2}f=f''(x)\,\mathrm {d} x\,\mathrm {d} x

Cette quantité s'appelle la différentielle d'ordre 2 de f {\displaystyle f} $f$ .

Plus généralement, si f {\displaystyle f} $f$ est n {\displaystyle n} $n$ fois dérivable sur I {\displaystyle I} $I$ , on appelle différentielle d'ordre n {\displaystyle n} $n$ sur I {\displaystyle I} $I$ , l'expression :

d n f = f ( n ) ( x ) ( d x ) n {\displaystyle \mathrm {d} ^{n}f=f^{(n)}(x)(\mathrm {d} x)^{n}}

\mathrm {d} ^{n}f=f^{(n)}(x)(\mathrm {d} x)^{n}

Cas de la fonction réelle à deux variables

Si f {\displaystyle f} $f$ est une fonction différentiable de U {\displaystyle U} $U$ (ouvert de R 2 {\displaystyle \mathbb {R} ^{2}} $\mathbb {R} ^{2}$ ) dans R {\displaystyle \mathbb {R} } $\mathbb {R}$ , alors d f = ∂ f ∂ x d x + ∂ f ∂ y d y {\displaystyle \mathrm {d} f={\tfrac {\partial f}{\partial x}}\,\mathrm {d} x+{\tfrac {\partial f}{\partial y}}\,\mathrm {d} y} $\mathrm {d} f={\tfrac {\partial f}{\partial x}}\,\mathrm {d} x+{\tfrac {\partial f}{\partial y}}\,\mathrm {d} y$ . Chacune des fonctions ∂ f ∂ x {\displaystyle {\tfrac {\partial f}{\partial x}}} ${\tfrac {\partial f}{\partial x}}$ et ∂ f ∂ y {\displaystyle {\tfrac {\partial f}{\partial y}}} ${\tfrac {\partial f}{\partial y}}$ est elle-même une fonction de U {\displaystyle U} $U$ dans R {\displaystyle \mathbb {R} } $\mathbb {R}$ . Si elles sont de classe C1 (c'est-à-dire différentiables de différentielle continue) alors d f {\displaystyle \mathrm {d} f} $\mathrm {d} f$ est aussi différentiable et :

d 2 f = ( ∂ 2 f ∂ x ∂ x d x + ∂ 2 f ∂ x ∂ y d y ) d x + ( ∂ 2 f ∂ y ∂ x d x + ∂ 2 f ∂ y ∂ y d y ) d y {\displaystyle \mathrm {d} ^{2}f=\left({\frac {\partial ^{2}f}{\partial x\partial x}}\,\mathrm {d} x+{\frac {\partial ^{2}f}{\partial x\partial y}}\,\mathrm {d} y\right)\,\mathrm {d} x+\left({\frac {\partial ^{2}f}{\partial y\partial x}}\,\mathrm {d} x+{\frac {\partial ^{2}f}{\partial y\partial y}}\,\mathrm {d} y\right)\mathrm {d} y}

\mathrm {d} ^{2}f=\left({\frac {\partial ^{2}f}{\partial x\partial x}}\,\mathrm {d} x+{\frac {\partial ^{2}f}{\partial x\partial y}}\,\mathrm {d} y\right)\,\mathrm {d} x+\left({\frac {\partial ^{2}f}{\partial y\partial x}}\,\mathrm {d} x+{\frac {\partial ^{2}f}{\partial y\partial y}}\,\mathrm {d} y\right)\mathrm {d} y

Comme les différentielles sont continues, le théorème de Schwarz permet de dire que :

∂ 2 f ∂ x ∂ y = ∂ 2 f ∂ y ∂ x {\displaystyle {\frac {\partial ^{2}f}{\partial x\partial y}}={\frac {\partial ^{2}f}{\partial y\partial x}}}

{\frac {\partial ^{2}f}{\partial x\partial y}}={\frac {\partial ^{2}f}{\partial y\partial x}}

ce qui permet d'écrire la différentielle d'ordre 2 de f {\displaystyle f} $f$ sous la forme suivante :

d 2 f = ∂ 2 f ∂ x ∂ x ( d x ) 2 + 2 ∂ 2 f ∂ x ∂ y d x d y + ∂ 2 f ∂ y ∂ y ( d y ) 2 = ( ∂ ∂ x d x + ∂ ∂ y d y ) 2 f {\displaystyle \mathrm {d} ^{2}f={\frac {\partial ^{2}f}{\partial x\partial x}}\,(\mathrm {d} x)^{2}+2\,{\frac {\partial ^{2}f}{\partial x\partial y}}\,\mathrm {d} x\,\mathrm {d} y+{\frac {\partial ^{2}f}{\partial y\partial y}}\,(\mathrm {d} y)^{2}=\left({\frac {\partial }{\partial x}}\,\mathrm {d} x+{\frac {\partial }{\partial y}}\,\mathrm {d} y\right)^{2}f}

\mathrm {d} ^{2}f={\frac {\partial ^{2}f}{\partial x\partial x}}\,(\mathrm {d} x)^{2}+2\,{\frac {\partial ^{2}f}{\partial x\partial y}}\,\mathrm {d} x\,\mathrm {d} y+{\frac {\partial ^{2}f}{\partial y\partial y}}\,(\mathrm {d} y)^{2}=\left({\frac {\partial }{\partial x}}\,\mathrm {d} x+{\frac {\partial }{\partial y}}\,\mathrm {d} y\right)^{2}f

où ( ∂ ∂ x d x + ∂ ∂ y d y ) {\displaystyle {\bigl (}{\tfrac {\partial }{\partial x}}\,\mathrm {d} x+{\tfrac {\partial }{\partial y}}\,\mathrm {d} y{\bigr )}} ${\bigl (}{\tfrac {\partial }{\partial x}}\,\mathrm {d} x+{\tfrac {\partial }{\partial y}}\,\mathrm {d} y{\bigr )}$ devient un opérateur agissant sur f {\displaystyle f} $f$

Plus généralement, si f {\displaystyle f} $f$ est de classe C n {\displaystyle C^{n}} $C^{n}$ alors (formellement, dans l'algèbre des opérateurs) :

d n f = ( ∂ ∂ x d x + ∂ ∂ y d y ) n f {\displaystyle \mathrm {d} ^{n}f=\left({\frac {\partial }{\partial x}}\,\mathrm {d} x+{\frac {\partial }{\partial y}}\,\mathrm {d} y\right)^{n}f}

\mathrm {d} ^{n}f=\left({\frac {\partial }{\partial x}}\,\mathrm {d} x+{\frac {\partial }{\partial y}}\,\mathrm {d} y\right)^{n}f

Cas général

On considère deux espaces vectoriels normés E {\displaystyle E} $E$ et F {\displaystyle F} $F$ , U {\displaystyle U} $U$ un ouvert de E {\displaystyle E} $E$ et f : U → F {\displaystyle f:U\to F} $f:U\to F$ .

On dit que f {\displaystyle f} $f$ est deux fois différentiable en a ∈ U {\displaystyle a\in U} $a\in U$ si :

f {\displaystyle f} $f$ est différentiable sur U {\displaystyle U} $U$ (de différentielle f ′ ( x ) ∈ L ( E , F ) {\displaystyle f'(x)\in {\mathcal {L}}(E,F)} $f'(x)\in {\mathcal {L}}(E,F)$ pour tout x ∈ U {\displaystyle x\in U} $x\in U$ ),
l'application f ′ : U → L ( E , F ) {\displaystyle f':U\to {\mathcal {L}}(E,F)} $f':U\to {\mathcal {L}}(E,F)$ est différentiable en a {\displaystyle a} $a$ (au sens de la métrique induite sur L ( E , F ) {\displaystyle {\mathcal {L}}(E,F)} ${\mathcal {L}}(E,F)$ ).

L'application dérivée seconde est donc une fonction f ″ : U → L ( E , L ( E , F ) ) {\displaystyle f'':U\to {\mathcal {L}}(E,{\mathcal {L}}(E,F))} $f'':U\to {\mathcal {L}}(E,{\mathcal {L}}(E,F))$ et la différentielle seconde en a {\displaystyle a} $a$ est l'application f ″ ( a ) ∈ L ( E , L ( E , F ) ) {\displaystyle f''(a)\in {\mathcal {L}}(E,{\mathcal {L}}(E,F))} $f''(a)\in {\mathcal {L}}(E,{\mathcal {L}}(E,F))$ .

Mais intéressons-nous de plus près à f ″ ( a ) {\displaystyle f''(a)} $f''(a)$ . Il s'agit d'une application linéaire continue f ″ ( a ) : E → L ( E , F ) {\displaystyle f''(a):E\to {\mathcal {L}}(E,F)} $f''(a):E\to {\mathcal {L}}(E,F)$ . De même, une fois choisi x ∈ E {\displaystyle x\in E} $x\in E$ l'application f ″ ( a ) x : E → F {\displaystyle f''(a)x:E\to F} $f''(a)x:E\to F$ est linéaire continue.

L'application f ″ ( a ) {\displaystyle f''(a)} $f''(a)$ peut donc être interprétée comme l'application bilinéaire continue f ″ ( a ) : E × E → F , ( x , y ) ↦ ( ( f ′ ) ′ ( a ) x ) y {\displaystyle f''(a):E\times E\to F,\,(x,y)\mapsto ((f')'(a)x)y} $f''(a):E\times E\to F,\,(x,y)\mapsto ((f')'(a)x)y$ . D'après le théorème de Schwarz, elle est de plus symétrique.

De manière générale, on définit la différentielle d'ordre n {\displaystyle n} $n$ de f {\displaystyle f} $f$ en a {\displaystyle a} $a$ comme l'application n {\displaystyle n} $n$ -linéaire symétrique continue f ( n ) ( a ) : E n → F , ( x 1 , . . . , x n ) ↦ ( . . . ( ( f ( n ) ( a ) x 1 ) x 2 ) . . . ) x n {\displaystyle f^{(n)}(a):E^{n}\to F,\,(x_{1},...,x_{n})\mapsto (...((f^{(n)}(a)x_{1})x_{2})...)x_{n}} $f^{(n)}(a):E^{n}\to F,\,(x_{1},...,x_{n})\mapsto (...((f^{(n)}(a)x_{1})x_{2})...)x_{n}$ .

Notes et références

Notes

Il est cependant possible de réintroduire de manière rigoureuse la notion d’« infiniment petit » ; voir l'article Analyse non standard.
Pour une démonstration, voir par exemple le chapitre « Différentiabilité » de la leçon « Calcul différentiel » sur Wikiversité (lien en bas de page).

Références

Jean Mawhin, Analyse : Fondements, techniques, évolution, Paris/Bruxelles, De Boeck Université, 1997, 808 p. (ISBN 2-8041-2489-4), p. ?.

Bibliographie

Henri Cartan, Cours de calcul différentiel, éditions Hermann, 1967 (plusieurs rééditions).