Cet article ne cite pas suffisamment ses sources (décembre 2019).
Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».
En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?
En analyse fonctionnelle et vectorielle, on appelle différentielle d'ordre 1 d'une fonction en un point a {\displaystyle a} (ou dérivée de cette fonction au point a {\displaystyle a} ) la partie linéaire de l'accroissement de cette fonction entre a {\displaystyle a} et a + h {\displaystyle a+h} lorsque h {\displaystyle h} tend vers 0. Elle généralise aux fonctions de plusieurs variables la notion de nombre dérivé d'une fonction d'une variable réelle, et permet ainsi d'étendre celle de développements limités. Cette différentielle n'existe pas toujours, et une fonction possédant une différentielle en un point est dite différentiable en ce point. On peut ensuite calculer des différentielles d'ordre supérieur à 1.
On utilise la notation différentielle avec beaucoup d'efficacité dans le cadre du calcul d'approximations et du calcul de dérivées. Elle facilite la formule de la dérivée de la composée. Elle se révèle très pratique dans le changement de variable en calcul intégral.
Dans l'approche de Leibniz, la différentielle d'une fonction est son « accroissement infinitésimal », qui s'écrit comme une combinaison des accroissements infinitésimaux des différentes variables. Ainsi pour une fonction f {\displaystyle f} des variables x {\displaystyle x} et y {\displaystyle y} , l'accroissement infinitésimal d f {\displaystyle \mathrm {d} f} s'exprime sous la forme :
d f = ∂ f ∂ x d x + ∂ f ∂ y d y = p d x + q d y {\displaystyle \mathrm {d} f={\frac {\partial f}{\partial x}}\,\mathrm {d} x+{\frac {\partial f}{\partial y}}\,\mathrm {d} y=p\,\mathrm {d} x+q\,\mathrm {d} y}où ∂ f ∂ x {\displaystyle {\frac {\partial f}{\partial x}}} dérivées partielles de f {\displaystyle f} .
et ∂ f ∂ y {\displaystyle {\frac {\partial f}{\partial y}}} sont lesLe calcul différentiel ainsi conçu, s'il était un outil de calcul efficace, manquait d'un fondement rigoureux, en particulier en ce qui concerne la notion de quantité infinitésimale. La notion moderne de différentielle est l'outil algébrique qui permet de passer des accroissements finis δ x {\displaystyle \delta x} , δ y {\displaystyle \delta y} des variables à l'accroissement δ f {\displaystyle \delta f} de la fonction, en se limitant au premier ordre d'approximation. Mathématiquement, il n'est plus question de petite variation mais de calcul au premier ordre, dont la définition s'exprime sous forme d'une limite.
Il convient cependant de ne pas négliger la puissance d'évocation et l'efficacité dans les calculs du point de vue original de Leibniz. C'est ce qui explique qu'il reste massivement utilisé, notamment par les physiciens ou les économistes. En introduisant la notion avancée de calcul tensoriel sur les variétés, les mathématiciens ont pu assurer un statut précis aux notations différentielles de tous ordres.
Le calcul différentiel, pour les fonctions d'une seule variable, se confond avec la dérivation. Soit f {\displaystyle f} une fonction d'une variable réelle, à valeurs réelles ; on notera y = f ( x ) {\displaystyle y=f(x)} le résultat de l'application de f {\displaystyle f} . Elle est dite dérivable en a {\displaystyle a} lorsqu'il existe un réel, noté f ′ ( a ) {\displaystyle f'(a)} , tel que pour tout réel h {\displaystyle h} on ait :
f ( a + h ) = f ( a ) + f ′ ( a ) h + h ε ( h ) {\displaystyle f(a+h)=f(a)+f'(a)\,h+h\,\varepsilon (h)}où ε {\displaystyle \varepsilon } notation de Landau) :
f ( a + h ) = f ( a ) + f ′ ( a ) h + o ( h ) . {\displaystyle f(a+h)=f(a)+f'(a)\,h+o(h).} est une fonction ayant une limite nulle en 0. f ′ ( a ) {\displaystyle f'(a)} est alors appelé nombre dérivé de f {\displaystyle f} en a {\displaystyle a} . On résume souvent cela par la notation (diteIntuitivement ce calcul de limite, qui porte le nom de développement limité à l'ordre 1 pour la fonction f {\displaystyle f} en a {\displaystyle a} , signifie qu'en première approximation, pour h {\displaystyle h} proche de 0, la valeur de f ( a + h ) {\displaystyle f(a+h)} est peu différente de celle de f ( a ) + f ′ ( a ) ⋅ h {\displaystyle f(a)+f'(a)\cdot h} . Notamment parmi les expressions affines (c'est-à-dire de la forme α + β ⋅ h {\displaystyle \alpha +\beta \cdot h} ), c'est celle-ci qui donne la meilleure approximation de f ( a + h ) {\displaystyle f(a+h)} .
Introduction intuitive des notations du calcul infinitésimalDans de nombreuses applications, des notations parlantes sont employées pour décrire cette situation. On convient de noter le nombre h {\displaystyle h}
d y = f ( a + h ) − f ( a ) ≃ f ′ ( a ) d x . {\displaystyle \mathrm {d} y=f(a+h)-f(a)\simeq f'(a)\,\mathrm {d} x.} par d x {\displaystyle \mathrm {d} x} pour indiquer qu'il représente une très petite variation de x {\displaystyle x} par rapport à la valeur de référence a {\displaystyle a} . On note d y {\displaystyle \mathrm {d} y} la variation de l'image par rapport à la valeur de référence :Le point de vue couramment adopté (surtout en physique), abusif en toute rigueur, est que pour des variations suffisamment petites, on peut écrire d y = f ′ ( a ) d x {\displaystyle \mathrm {d} y=f'(a)\,\mathrm {d} x} . Cette présentation escamote en effet la nécessité d'utiliser un calcul de limite, car même pour des variations très petites, le terme d'erreur noté o ( h ) {\displaystyle o(h)} ci-dessus n'a pas de raison d'être nul. Mathématiquement parlant, il serait plus juste de noter cela :
δ y ≃ f ′ ( a ) δ x {\displaystyle \delta y\simeq f'(a)\,\delta x}car les mathématiciens prouvent la formule exacte d y = f ′ ( a ) d x {\displaystyle \mathrm {d} y=f'(a)\,\mathrm {d} x}
, en donnant aux notations d x {\displaystyle \mathrm {d} x} et d y {\displaystyle \mathrm {d} y} un sens précis qui n'est pas celui de petites variations et qui sera détaillé plus bas.Soit f {\displaystyle f} fonction des deux variables x {\displaystyle x} et y {\displaystyle y} ; on notera z = f ( x , y ) {\displaystyle z=f(x,y)} le résultat de l'application de f {\displaystyle f} .
Valeur attendue pour la différentielle uneDe nouveau, la question posée peut être formulée ainsi : lorsque, par rapport à des valeurs de référence a {\displaystyle a}
et b {\displaystyle b} , on augmente les variables x {\displaystyle x} et y {\displaystyle y} des quantités d x {\displaystyle \mathrm {d} x} et d y {\displaystyle \mathrm {d} y} , quel est l'effet (au premier ordre) sur la variable z {\displaystyle z} ?Les dérivées partielles permettent de répondre à la question lorsqu'une des deux variations est nulle. Ainsi, parce que c'est un simple calcul de dérivée de fonction d'une variable, il est possible d'écrire :
d z a , b = d f a , b = ∂ f ∂ x ( a , b ) d x {\displaystyle \mathrm {d} z_{a,b}=\mathrm {d} f_{a,b}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x} lorsque d y = 0 {\displaystyle \mathrm {d} y=0}et de même en inversant les rôles : si d x {\displaystyle \mathrm {d} x}
est nul, d z {\displaystyle \mathrm {d} z} se calcule à l'aide de la deuxième dérivée partielle.Il semblerait naturel que lorsqu'on augmente x {\displaystyle x}
d z a , b = d f a , b = ∂ f ∂ x ( a , b ) d x + ∂ f ∂ y ( a , b ) d y {\displaystyle \mathrm {d} z_{a,b}=\mathrm {d} f_{a,b}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x+{\frac {\partial f}{\partial y}}(a,b)\,\mathrm {d} y} et y {\displaystyle y} respectivement des quantités infiniment petites d x {\displaystyle \mathrm {d} x} et d y {\displaystyle \mathrm {d} y} , l'augmentation totale soit obtenue en superposant les deux cas précédents :ce qu'en physique on énonce en général sous la forme : la différentielle « totale » est la somme des « différentielles partielles ».
On écrira par exemple : si z = x 2 + x y {\displaystyle z=x^{2}+xy}
Le problème de la différentiabilité alors d z = d f = ( 2 x + y ) d x + x d y {\displaystyle \mathrm {d} z=\mathrm {d} f=(2x+y)\,\mathrm {d} x+x\,\mathrm {d} y} . De fait, cette formule sera vérifiée dans de très nombreux calculs explicites ; mais elle n'est pas vraie en toute généralité.Il faut détailler le raisonnement pour voir où il pèche. On peut faire subir d'abord une augmentation de d x {\displaystyle \mathrm {d} x}
d z 1 = ∂ f ∂ x ( a , b ) d x {\displaystyle \mathrm {d} z_{1}={\frac {\partial f}{\partial x}}(a,b)\,\mathrm {d} x} à la seule variable x {\displaystyle x} , ce qui la fait passer de la valeur a {\displaystyle a} à a + d x {\displaystyle a+\mathrm {d} x} , tandis que y {\displaystyle y} reste égal à b {\displaystyle b} . Puis, en maintenant x = a + d x {\displaystyle x=a+\mathrm {d} x} constant, on fait passer y {\displaystyle y} de b {\displaystyle b} à b + d y {\displaystyle b+\mathrm {d} y} . Les accroissements de z {\displaystyle z} résultants sont donc plus précisément : et d z 2 = ∂ f ∂ y ( a + d x , b ) d y {\displaystyle \mathrm {d} z_{2}={\frac {\partial f}{\partial y}}(a+\mathrm {d} x,b)\,\mathrm {d} y}et encore si cette deuxième quantité existe effectivement.
L'existence de dérivées partielles au seul point ( a , b ) {\displaystyle (a,b)} continues sur un voisinage de ( a , b ) {\displaystyle (a,b)} , on pourra effectivement affirmer que d z {\displaystyle \mathrm {d} z} a la valeur attendue.
est a priori insuffisant pour écrire une formule générale de calcul de d z {\displaystyle \mathrm {d} z} . En revanche, si l'on suppose que les dérivées partielles sont définies etEn termes généraux, la différentiabilité est l'existence d'un développement limité à l'ordre 1 en un point, et la différentielle est la partie d'ordre 1 (donc linéaire) exactement.
Étudions en premier lieu une fonction de deux variables, à valeurs réelles : on notera z = f ( x , y ) {\displaystyle z=f(x,y)}
f ( x + h 1 , y + h 2 ) = f ( x , y ) + α h 1 + β h 2 + o ( h 1 2 + h 2 2 ) {\displaystyle f(x+h_{1},y+h_{2})=f(x,y)+\alpha \,h_{1}+\beta \,h_{2}+o\left({\sqrt {{h_{1}}^{2}+{h_{2}}^{2}}}\right)} . Cette fonction sera dite différentiable au point m {\displaystyle m} de coordonnées ( x , y ) {\displaystyle (x,y)} s'il existe une formule de développement limité d'ordre 1 pour la fonction en ce point, c'est-à-dire :avec α {\displaystyle \alpha }
lim ( h 1 , h 2 ) → ( 0 , 0 ) f ( x + h 1 , y + h 2 ) − f ( x , y ) − α h 1 − β h 2 h 1 2 + h 2 2 = 0 {\displaystyle \lim _{(h_{1},h_{2})\to (0,0)}{\frac {f(x+h_{1},y+h_{2})-f(x,y)-\alpha h_{1}-\beta h_{2}}{\sqrt {{h_{1}}^{2}+{h_{2}}^{2}}}}=0} et β {\displaystyle \beta } des coefficients réels, ou encore :La limite est à prendre au sens des limites de fonctions de deux variables.
Si la fonction est différentiable, on montre que les coefficients α {\displaystyle \alpha }
f ( x + h 1 , y + h 2 ) = f ( m + h → ) = f ( m ) + L ( h → ) + o ( ‖ h → ‖ ) {\displaystyle f(x+h_{1},y+h_{2})=f(m+{\vec {h}})=f(m)+L({\vec {h}})+o(\|{\vec {h}}\|)} et β {\displaystyle \beta } sont bien les dérivées partielles de f {\displaystyle f} . On peut alors écrire :avec l'expression suivante qui est linéaire en h → = ( h 1 , h 2 ) {\displaystyle {\vec {h}}=(h_{1},h_{2})}
L ( h → ) = ∂ f ∂ x ( x , y ) h 1 + ∂ f ∂ y ( x , y ) h 2 . {\displaystyle L({\vec {h}})={\frac {\partial f}{\partial x}}(x,y)\,h_{1}+{\frac {\partial f}{\partial y}}(x,y)\,h_{2}.}L'application linéaire L {\displaystyle L}
est appelée différentielle de f {\displaystyle f} au point m {\displaystyle m} et peut se noter d f ( m ) {\displaystyle \mathrm {d} f(m)} ou bien d f m {\displaystyle \mathrm {d} f_{m}} .On peut reprendre l'interprétation intuitive de L {\displaystyle L}
. Si les variables subissent une petite modification δ ℓ → {\displaystyle \delta {\vec {\ell }}} , l'effet sur la fonction est une modification δ f = L ( δ ℓ → ) {\displaystyle \delta f=L(\delta {\vec {\ell }})} , à condition de s'empresser d'ajouter : « du moins au premier ordre ».Cette première notion se généralise aux fonctions de R n {\displaystyle \mathbb {R} ^{n}}
f → ( a 1 + h 1 , … , a n + h n ) = f → ( a 1 , … , a n ) + h 1 α 1 → + ⋯ + h n α n → + o ( ‖ h → ‖ ) {\displaystyle {\vec {f}}(a_{1}+h_{1},\dots ,a_{n}+h_{n})={\vec {f}}(a_{1},\dots ,a_{n})+h_{1}\,{\vec {\alpha _{1}}}+\dots +h_{n}\,{\vec {\alpha _{n}}}+o\left(\|{\vec {h}}\|\right)} dans R {\displaystyle \mathbb {R} } , en changeant simplement le nombre de variables, puis aux fonctions de R n {\displaystyle \mathbb {R} ^{n}} dans R p {\displaystyle \mathbb {R} ^{p}} en admettant des coefficients vectoriels pour le développement limité. Une fonction f → {\displaystyle {\vec {f}}} de R n {\displaystyle \mathbb {R} ^{n}} dans R p {\displaystyle \mathbb {R} ^{p}} sera dite différentiable en a {\displaystyle a} s'il existe un développement de la forme :avec ‖ h → ‖ {\displaystyle \|{\vec {h}}\|} norme du vecteur de composantes ( h 1 , . . . , h n ) {\displaystyle (h_{1},...,h_{n})} . Cette condition peut aussi s'écrire comme :
lim h → → 0 → f → ( a 1 + h 1 , … , a n + h n ) − f → ( a 1 , … , a n ) − h 1 α 1 → − ⋯ − h n α n → ‖ h → ‖ = 0 → {\displaystyle \lim _{{\vec {h}}\to {\vec {0}}}{\frac {{\vec {f}}(a_{1}+h_{1},\dots ,a_{n}+h_{n})-{\vec {f}}(a_{1},\dots ,a_{n})-h_{1}\,{\vec {\alpha _{1}}}-\dots -h_{n}\,{\vec {\alpha _{n}}}}{\|{\vec {h}}\|}}={\vec {0}}} qui désigne laLa limite est à prendre au sens des limites de fonctions de n {\displaystyle n}
d f → ( a ) ( h → ) = ∂ f → ∂ x 1 ( a ) h 1 + ⋯ + ∂ f → ∂ x n ( a ) h n {\displaystyle \mathrm {d} {\vec {f}}(a)({\vec {h}})={\frac {\partial {\vec {f}}}{\partial x_{1}}}(a)\,h_{1}+\dots +{\frac {\partial {\vec {f}}}{\partial x_{n}}}(a)\,h_{n}} variables. De nouveau, si la fonction est différentiable, on montre que les coefficients { α i → } i = 1 , … , n {\displaystyle \{{\vec {\alpha _{i}}}\}_{i=1,\dots ,n}} apparaissant dans ce développement sont les dérivées partielles de f → {\displaystyle {\vec {f}}} . On notera donc :Pour effectuer ce calcul il est judicieux d'introduire des représentations matricielles pour le vecteur h → {\displaystyle {\vec {h}}} matrice jacobienne de l'application. C'est une matrice de dimension ( p , n ) {\displaystyle (p,n)} . Le calcul de d f → ( a ) ( h → ) {\displaystyle \mathrm {d} {\vec {f}}(a)({\vec {h}})} peut aussi être présenté comme un calcul de produit scalaire du vecteur h → {\displaystyle {\vec {h}}} avec le vecteur gradient de f {\displaystyle f} au point a {\displaystyle a} .
et l'application linéaire d f → ( a ) {\displaystyle \mathrm {d} {\vec {f}}(a)} : c'est ce que l'on appelle laLa différentiabilité de la fonction assure l'existence de dérivées partielles ; la réciproque est fausse : l'existence de dérivées partielles n'assure pas la différentiabilité de la fonction, ni même sa continuité.
Il existe cependant un résultat positif : si les dérivées partielles de f {\displaystyle f}
existent et sont continues, alors f {\displaystyle f} est différentiable.Si l'application f {\displaystyle f}
d f → ( a ) = ∂ f → ∂ x 1 ( a ) d x 1 + ⋯ + ∂ f → ∂ x n ( a ) d x n {\displaystyle \mathrm {d} {\vec {f}}(a)={\frac {\partial {\vec {f}}}{\partial x_{1}}}(a)\,\mathrm {d} x_{1}+\dots +{\frac {\partial {\vec {f}}}{\partial x_{n}}}(a)\,\mathrm {d} x_{n}} est linéaire, alors elle est différentiable en tout point a {\displaystyle a} et d f ( a ) = f {\displaystyle \mathrm {d} f(a)=f} . Ceci s'applique en particulier à chaque fonction coordonnée R n → R {\displaystyle \mathbb {R} ^{n}\to \mathbb {R} } , x → x k {\displaystyle x\to x_{k}} — dont la dérivée en tout point a {\displaystyle a} , d x k ( a ) : h → h k {\displaystyle \mathrm {d} x_{k}(a)\,:\,h\to h_{k}} , est simplement notée d x k {\displaystyle \mathrm {d} x_{k}} — et justifie la réécriture suivante de la différentielle de f → {\displaystyle {\vec {f}}} en a {\displaystyle a} :
En calcul infinitésimal, l'habitude est de noter d f {\displaystyle \mathrm {d} f} infinitésimale de x → {\displaystyle {\vec {x}}} , alors la différentielle de f {\displaystyle f} au point x → {\displaystyle {\vec {x}}} définit les variations infinitésimales de f {\displaystyle f} correspondant aux variations infinitésimales de x → {\displaystyle {\vec {x}}} et s'écrit :
d f ( x → ) = ∑ i ∂ f ( x → ) ∂ x i d x i {\displaystyle \mathrm {d} f({\vec {x}})=\sum _{i}{\frac {\partial f({\vec {x}})}{\partial x_{i}}}\,\mathrm {d} x_{i}} des variations infinitésimales d'une fonction f {\displaystyle f} . Ainsi, soient f {\displaystyle f} , une fonction de x → = ( x 1 , … , x n ) {\displaystyle {\vec {x}}=(x_{1},\dots ,x_{n})} et d x → = ( d x 1 , … , d x n ) {\displaystyle \mathrm {d} {\vec {x}}=(\mathrm {d} x_{1},\dots ,\mathrm {d} x_{n})} où les d x i {\displaystyle \mathrm {d} x_{i}} sont les composantes d'une variationou, en notation tensorielle avec la convention de sommation d'Einstein :
d f ( x → ) = ∂ f ( x → ) ∂ x i d x i {\displaystyle \mathrm {d} f({\vec {x}})={\frac {\partial f({\vec {x}})}{\partial x_{i}}}\,\mathrm {d} x_{i}}Pour bien comprendre cette formule, il faut comprendre que l'accroissement infinitésimal ∂ f {\displaystyle \partial f} dérivées partielles qui sont indépendantes les unes des autres, et que par contre, on calcule la relation entre d f ( x → ) {\displaystyle \mathrm {d} f({\vec {x}})} et les d x i {\displaystyle \mathrm {d} x_{i}} qui sont, eux, liés entre eux par la direction dans laquelle on fait varier x → {\displaystyle {\vec {x}}} .
est lié aux accroissements infinitésimaux ∂ x i {\displaystyle \partial x_{i}} par lesPlus généralement, il est possible de définir la notion de différentiabilité et de différentielle sans avoir recours à des bases.
Soient E {\displaystyle E} espace vectoriel normé, F {\displaystyle F} un espace vectoriel topologique séparé, f {\displaystyle f} une application de E {\displaystyle E} dans F {\displaystyle F} et a {\displaystyle a} un point de E {\displaystyle E} . On abandonne la notation des vecteurs par des flèches dans ce paragraphe.
unOn dit que f {\displaystyle f} Fréchet) s'il existe une application linéaire continue L : E → F {\displaystyle L:E\to F} telle que :
∀ h ∈ E f ( a + h ) = f ( a ) + L ( h ) + o ( ‖ h ‖ ) {\displaystyle \forall h\in E\quad f(a+h)=f(a)+L(h)+o\left(\|h\|\right)} est différentiable en a {\displaystyle a} (au sens deou, de manière équivalente :
lim h → 0 f ( a + h ) − f ( a ) − L ( h ) ‖ h ‖ = 0. {\displaystyle \lim _{h\to 0}{\frac {f(a+h)-f(a)-L(h)}{\|h\|}}=0.}Une telle application linéaire L {\displaystyle L} . Elle est appelée différentielle de f {\displaystyle f} en a {\displaystyle a} et se note L = d f ( a ) {\displaystyle L=\mathrm {d} f(a)} . De plus, sa continuité assure la continuité en a {\displaystyle a} de f {\displaystyle f} .
est alors uniqueLa différentiabilité dépend de la norme choisie sur E {\displaystyle E} voir supra) puisque toutes les normes y sont équivalentes. Notons que pour h ∈ E {\displaystyle h\in E} fixé, l'application D f ( . ) ( h ) : E → F : a ↦ d f ( a ) ( h ) {\displaystyle Df(.)(h):E\to F:a\mapsto \mathrm {d} f(a)(h)} n'a aucune raison d'être linéaire. Par exemple pour E = F = R {\displaystyle E=F=\mathbb {R} } , f = sin {\displaystyle f=\sin } et h = 1 {\displaystyle h=1} , on a D f ( . ) ( h ) = cos {\displaystyle Df(.)(h)=\cos } .
; on retrouve, cela dit, la définition usuelle en dimension finie (On peut remarquer le changement sémantique entre la première définition, celle de Leibniz – un accroissement très petit –, et celle formalisée de nos jours – une application linéaire. Ce changement est l'aboutissement d'une évolution de plus de trois siècles entre une idée intuitive du calcul infinitésimal et sa formalisation.
La différentielle d'une fonction composée est donnée (sous de bonnes hypothèses) par, :
d ( g ∘ f ) ( a ) = d g ( f ( a ) ) ∘ d f ( a ) {\displaystyle \mathrm {d} (g\circ f)(a)=\mathrm {d} g(f(a))\circ \mathrm {d} f(a)}Si y = f ( x ) {\displaystyle y=f(x)} dérivable sur I {\displaystyle I} , alors d f = f ′ ( x ) d x {\displaystyle \mathrm {d} f=f'(x)\,\mathrm {d} x} . Si de plus, f ′ {\displaystyle f'} est dérivable, d f {\displaystyle \mathrm {d} f} est différentiable et :
d 2 f = f ″ ( x ) d x d x {\displaystyle \mathrm {d} ^{2}f=f''(x)\,\mathrm {d} x\,\mathrm {d} x} , si f {\displaystyle f} estCette quantité s'appelle la différentielle d'ordre 2 de f {\displaystyle f}
.Plus généralement, si f {\displaystyle f}
d n f = f ( n ) ( x ) ( d x ) n {\displaystyle \mathrm {d} ^{n}f=f^{(n)}(x)(\mathrm {d} x)^{n}} est n {\displaystyle n} fois dérivable sur I {\displaystyle I} , on appelle différentielle d'ordre n {\displaystyle n} sur I {\displaystyle I} , l'expression :Si f {\displaystyle f} ouvert de R 2 {\displaystyle \mathbb {R} ^{2}} ) dans R {\displaystyle \mathbb {R} } , alors d f = ∂ f ∂ x d x + ∂ f ∂ y d y {\displaystyle \mathrm {d} f={\tfrac {\partial f}{\partial x}}\,\mathrm {d} x+{\tfrac {\partial f}{\partial y}}\,\mathrm {d} y} . Chacune des fonctions ∂ f ∂ x {\displaystyle {\tfrac {\partial f}{\partial x}}} et ∂ f ∂ y {\displaystyle {\tfrac {\partial f}{\partial y}}} est elle-même une fonction de U {\displaystyle U} dans R {\displaystyle \mathbb {R} } . Si elles sont de classe C1 (c'est-à-dire différentiables de différentielle continue) alors d f {\displaystyle \mathrm {d} f} est aussi différentiable et :
d 2 f = ( ∂ 2 f ∂ x ∂ x d x + ∂ 2 f ∂ x ∂ y d y ) d x + ( ∂ 2 f ∂ y ∂ x d x + ∂ 2 f ∂ y ∂ y d y ) d y {\displaystyle \mathrm {d} ^{2}f=\left({\frac {\partial ^{2}f}{\partial x\partial x}}\,\mathrm {d} x+{\frac {\partial ^{2}f}{\partial x\partial y}}\,\mathrm {d} y\right)\,\mathrm {d} x+\left({\frac {\partial ^{2}f}{\partial y\partial x}}\,\mathrm {d} x+{\frac {\partial ^{2}f}{\partial y\partial y}}\,\mathrm {d} y\right)\mathrm {d} y} est une fonction différentiable de U {\displaystyle U} (Comme les différentielles sont continues, le théorème de Schwarz permet de dire que :
∂ 2 f ∂ x ∂ y = ∂ 2 f ∂ y ∂ x {\displaystyle {\frac {\partial ^{2}f}{\partial x\partial y}}={\frac {\partial ^{2}f}{\partial y\partial x}}}ce qui permet d'écrire la différentielle d'ordre 2 de f {\displaystyle f}
d 2 f = ∂ 2 f ∂ x ∂ x ( d x ) 2 + 2 ∂ 2 f ∂ x ∂ y d x d y + ∂ 2 f ∂ y ∂ y ( d y ) 2 = ( ∂ ∂ x d x + ∂ ∂ y d y ) 2 f {\displaystyle \mathrm {d} ^{2}f={\frac {\partial ^{2}f}{\partial x\partial x}}\,(\mathrm {d} x)^{2}+2\,{\frac {\partial ^{2}f}{\partial x\partial y}}\,\mathrm {d} x\,\mathrm {d} y+{\frac {\partial ^{2}f}{\partial y\partial y}}\,(\mathrm {d} y)^{2}=\left({\frac {\partial }{\partial x}}\,\mathrm {d} x+{\frac {\partial }{\partial y}}\,\mathrm {d} y\right)^{2}f} sous la forme suivante :où ( ∂ ∂ x d x + ∂ ∂ y d y ) {\displaystyle {\bigl (}{\tfrac {\partial }{\partial x}}\,\mathrm {d} x+{\tfrac {\partial }{\partial y}}\,\mathrm {d} y{\bigr )}}
devient un opérateur agissant sur f {\displaystyle f}Plus généralement, si f {\displaystyle f} algèbre des opérateurs) :
d n f = ( ∂ ∂ x d x + ∂ ∂ y d y ) n f {\displaystyle \mathrm {d} ^{n}f=\left({\frac {\partial }{\partial x}}\,\mathrm {d} x+{\frac {\partial }{\partial y}}\,\mathrm {d} y\right)^{n}f} est de classe C n {\displaystyle C^{n}} alors (formellement, dans l'On considère deux espaces vectoriels normés E {\displaystyle E}
et F {\displaystyle F} , U {\displaystyle U} un ouvert de E {\displaystyle E} et f : U → F {\displaystyle f:U\to F} .On dit que f {\displaystyle f}
est deux fois différentiable en a ∈ U {\displaystyle a\in U} si :L'application dérivée seconde est donc une fonction f ″ : U → L ( E , L ( E , F ) ) {\displaystyle f'':U\to {\mathcal {L}}(E,{\mathcal {L}}(E,F))} et la différentielle seconde en a {\displaystyle a} est l'application f ″ ( a ) ∈ L ( E , L ( E , F ) ) {\displaystyle f''(a)\in {\mathcal {L}}(E,{\mathcal {L}}(E,F))} .
Mais intéressons-nous de plus près à f ″ ( a ) {\displaystyle f''(a)} application linéaire continue f ″ ( a ) : E → L ( E , F ) {\displaystyle f''(a):E\to {\mathcal {L}}(E,F)} . De même, une fois choisi x ∈ E {\displaystyle x\in E} l'application f ″ ( a ) x : E → F {\displaystyle f''(a)x:E\to F} est linéaire continue.
. Il s'agit d'uneL'application f ″ ( a ) {\displaystyle f''(a)} application bilinéaire continue f ″ ( a ) : E × E → F , ( x , y ) ↦ ( ( f ′ ) ′ ( a ) x ) y {\displaystyle f''(a):E\times E\to F,\,(x,y)\mapsto ((f')'(a)x)y} . D'après le théorème de Schwarz, elle est de plus symétrique.
peut donc être interprétée comme l'De manière générale, on définit la différentielle d'ordre n {\displaystyle n} application n {\displaystyle n} continue f ( n ) ( a ) : E n → F , ( x 1 , . . . , x n ) ↦ ( . . . ( ( f ( n ) ( a ) x 1 ) x 2 ) . . . ) x n {\displaystyle f^{(n)}(a):E^{n}\to F,\,(x_{1},...,x_{n})\mapsto (...((f^{(n)}(a)x_{1})x_{2})...)x_{n}} -linéaire symétrique .
de f {\displaystyle f} en a {\displaystyle a} comme l'