Séries de Taylor, tenseurs et formalisme associé

a marqué ce sujet comme résolu.
Auteur du sujet

Bonsoir tout le monde !

Alors voilà, en chimie quantique, on a piqué cette vieille habitude qu’on les physiciens de faire une série de Taylor1 avec un peut n’importe quoi. Mais du coup, je ne suis pas certain des notations que j’utilise et des noms que je donne aux différentes choses.

Prenons un exemple qui me concerne directement. Le moment dipolaire d’une molécule sous l’action d’un champ électrique externe peut être exprimé sous la forme d’une série de Taylor (en fait de MacLaurin, mais soit) comme suis:

$$\mathbf{\mu}(\mathbf{f}) = \mathbf{\mu}(\mathbf 0) + \frac{1}{2!}\,\alpha\cdot \mathbf{f} + \frac{1}{3!}\,\beta\cdot\mathbf{f}^2 + \ldots$$

Bon, comme on ce doute un peu avec la notation, $\mathbf{\mu}(\mathbf{f})$ est une fonction vectorielle (le gras sur les lettres ça passe pas trop, mais si) avec $\mathbf{f}\in\mathbb{R}^3$ qui est un vecteur, et la fonction sort un truc dans $\mathbb{R}^3$ aussi. Ce qui fait, assez logiquement (?), de $\alpha$ un tenseur d’ordre 2 (dans $\mathbb{R}^{3\times 3}$ ?) et de $\beta$ un tenseur d’ordre 3 (dans $\mathbb{R}^{3\times 3 \times 3}$ ?!?) et ainsi de suite. C’est bien entendu valide à condition que $\mathbf{f}$ soit petit, quoique ça veille dire2.

Du coup, la série susmentionné permet d’écrire que $\alpha$ par exemple, on peut l’obtenir comme

$$\alpha = 2\,\left.\frac{\partial\mathbf{\mu}(\mathbf{f})}{\partial \mathbf{F}}\right|_{\mathbf{f}=\mathbf{0}}$$

Et ainsi de suite. Déjà, est ce que jusque là, j’ai le droit d’écrire tout ce que je vient de faire ?

Sauf qu’on est des tordus, et qu’on s’arrête pas là: nos tenseurs, on va ensuite en faire une série de Taylor (de Maclaurin, une fois encore, mais chut) par rapport à une autre variable. Parce que mathématiquement on a le droit de le faire, et que physiquement, ça a a peu près du sens. Par exemple, dans le cadre de ma thèse, il est nécessaire que je calcule $\frac{\partial\alpha}{\partial \mathbf{q}}$, sachant que $\mathbf{q}$ est également un vecteur3, mais pas de la même dimension que $\mathbf{f}$ (mettons 9 composantes, donc $\mathbf{q}\in\mathbb{R}^9$), et qu’on peut bien entendu écrire $\alpha(\mathbf{q}) = \alpha_0 + \frac{1}{2!}\,\eta\cdot\mathbf{q}+\ldots$, ce qui fait de $\eta$ un tenseur exprimé dans $\mathbb{R}^{3\times 3\times 9}$ ?

Si je vais un cran plus loin et que je dis que pour n’importe quel tenseur d’ordre $n$, $\chi\in\mathbb{R}^{a\times b\times \ldots \times n}$ et un vecteur $\mathbf{q}\in\mathbb{R}^{s}$, est ce que j’ai le droit d’écrire qu’on l’exprime comme une série de Maclaurin comme suis ?

$$\chi(\mathbf{q}) = \sum_{r=0}^{\infty} \frac{1}{r!}\frac{\partial^r\chi(0)}{\partial\mathbf{q}^r}\,\mathbf{q}^r$$

Et est ce que ça passe si je dit que du coup,

$$\zeta = t!\,\left.\frac{\partial^t\chi(\mathbf{q})}{\partial\mathbf{q}^t}\right|_{\mathbf{q}=0}$$

$\zeta$ est un tenseur d’ordre $n+t$, et qui est exprimé dans $\mathbb{R}^{a\times b\times \ldots \times n\times s^t}$ (c’est un $s^t$ à la fin, mais ça ce vois pas bien) ?

D’avance merci parce que tout ça est un peu confus dans ma tête et que je suis pas sur de tout ce que je fais (je suis pas sur que ce que j’ai appris est fondamentalement correct, parce qu’on fait beaucoup de raccourcis), et désolé pour les matheux que j’ai tué au passage :)


  1. ça pourrait être une série de puissance, notez, que ça changerai rien du tout, mais il se trouve que je croise plus des séries de Taylor que des séries de puissance dans mon domaine, une vieille histoire de formalisme. 

  2. Dans la vraie vie, $\mathbf{f}$ c’est le champ électrique, et donc ça signifie que c’est valide tant qu’on se met pas à appliquer des champs de malade avec des lasers, par exemple, mais restons sur les maths. 

  3. Dans la vraie vie, toujours, $\mathbf{q}_i$ est une coordonnée normale. Et donc $\frac{\partial\alpha}{\partial \mathbf{q}_i}$, ce serait la variation de $\alpha$ avec $\mathbf{q}$, autrement dit comment $\alpha$ change quand la molécule vibre. Une fois encore, peu importe ;) 

Édité par pierre_24

#JeSuisToujoursArius • Doctorant et assistant en chimiedev' à temps partiel (co-réalisateur ZEP-12, recherche et template LaTeX)

+0 -0

Cette réponse a aidé l’auteur du sujet

Coucou

J’ai un peu de mal à suivre. Est-ce que $f$ c’est une fonction à valeurs dans $\mathbf R$ ou $\mathbf R^3$? Et qu’est-ce que tu appelles les puissances de $f$ ?

Ensuite (j’attends de voir ta réponse pour en faire une vraie), je ne suis pas sûr que parler de tenseur soit très intéressant ici.

Une chose qu’on sait faire, pour $f:\mathbf R^3\to \mathbf R^3$ (disons $3$, mais la dimension n’a pas d’importance) c’est de regarder la série de Taylor :

$$ f(a+h) = f(a) + df_a(h) + \frac 12 d^2f_a(h,h) + \frac 16d^3f_a(h,h,h)+ \dots $$

avec $df$ la matrice des dérivées premières, $d^2f$ celles des secondes, etc.

edit : hum je vois que j’ai mal lu, et que c’est $\mu$ ta fonction. Dans ce cas, mon petit paragraphe est peut-être éclairant ?

Édité par Holosmos

+0 -0

Je n’ajoute rien à ce qu’Holosmos a dit. Je corrobore simplement son propos pour appuyer sur le fait que je ne comprends pas pourquoi introduire des tenseurs.

Fondamentalement, tu écris des développements limités d’ordre « grand », donc tu fais apparaître des différentielles d’ordre supérieur. J’ai l’impression que les interpréter comme des tenseurs ne permet pas de gagner grand-chose.

D’ailleurs en y repensant, je me rends compte que ces objets ne sont même pas des tenseurs (au sens géométrique du terme). C’est-à-dire qu’il ne sont pas $C^\infty$-linéaire. En d’autres termes, si $f:\mathbf R^3 \to \mathbf R$ est lisse, et si $g:\mathbf R^3 \to \mathbf R^3$ est une fonction lisse, alors

$$ d(fg) \neq f d(g) $$

et donc $d(g)$ n’est pas un tenseur :’(.

Mais cette tristesse passagère se transforme en une question magnifique ! Elle motive l’apparition des dérivées covariantes et donc des questions de courbure :-).

Édité par Holosmos

+0 -0
Banni

Ça veut dire quoi « $C^\infty$-linéaire » ? Ça doit commuter avec la postcomposition par des fonctions lisses ? Je ne comprends par ce que tu as écrit car les $d$ qui vérifient ça donnent $d(g) = g d(\id)$, non ? Ah non, j’ai compris, c’est une multiplication, par une composition. ><

Édité par blo yhg

+0 -0

La $C^\infty$-linéarité d’un opérateur, c’est la linéarité, plus, la commutativité avec les fonctions numériques (i.e. à valeurs réelles) lisses.

edit : c’est une caractérisation classique (et utile) des tenseurs

Édité par Holosmos

+0 -0
Auteur du sujet

Quand je vous dit que je suis absolument pas sur de ce que je note ^^

Allez, mettons que ce soit pas des tenseurs (C’est peut être un concept différent chez les physiciens, mais je vous promet que j’ai rien inventé), ça change pas grand chose a ma vie. C’est intéressant, d’ailleurs, cette propriété de $C^\infty-$linéarité :)

J’ai un peu de mal à suivre. Est-ce que $f$ c’est une fonction à valeurs dans $\mathbf R$ ou $\mathbf R^3$? Et qu’est-ce que tu appelles les puissances de $f$ ?

Dans $\mathbf R^3$?, mais à la limite, peu importe :)

Quand au puissance de $f$, je me rend compte qu’on fait ça comme des cochons, puisque je sous entend que

$$(\beta\cdot \mathbf{f}^2)_i = \sum_{jk} \beta_{jk}\,\mathbf{f}_j\,\mathbf{f}_k$$

Ce qui, en y regardant de pas trop près, à une gueule de produit scalaire.

Ensuite (j’attends de voir ta réponse pour en faire une vraie), je ne suis pas sûr que parler de tenseur soit très intéressant ici.

Possible. Probable :p Mais pour moi, on introduisait ça parce qu’on se retrouvais avec des objets de dimension $3\times 3\times 3$ pour $\beta$, par exemple, et que vu ce que j’ai dit plus haut, c’est plus logique de le noter comme ça qu’un objet $3\times 9$ (mais je me trompe probablement).

Une chose qu’on sait faire, pour $f:\mathbf R^3\to \mathbf R^3$ (disons $3$, mais la dimension n’a pas d’importance) c’est de regarder la série de Taylor :

$$ f(a+h) = f(a) + df_a(h) + \frac 12 d^2f_a(h,h) + \frac 16d^3f_a(h,h,h)+ \dots $$

avec $df$ la matrice des dérivées premières, $d^2f$ celles des secondes, etc.

Et justement, moi, ce qui m’intéresse in fine, c’est la dimension de ces matrices de dérivées et leur nom (puisque c’est pas des tenseurs). C’est ça que je désigne par des lettres grecques dans mon premier post et que j’essaye très maladroitement d’exprimer par

$$\alpha = 2\,\left.\frac{\partial\mathbf{\mu}(\mathbf{f})}{\partial \mathbf{F}}\right|_{\mathbf{f}=\mathbf{0}}$$

ce qui correspond a $df_a(0)$ dans ta série à toi :-)

En particulier je m’intéresse au cas ou $f(0+h)$ est une fonction qui sort une matrice elle-même.

Édité par pierre_24

#JeSuisToujoursArius • Doctorant et assistant en chimiedev' à temps partiel (co-réalisateur ZEP-12, recherche et template LaTeX)

+0 -0

Cette réponse a aidé l’auteur du sujet

Ok je pense avoir ciblé ta question.

Mettons de côté un instant la question de la nomenclature. Donc si j’ai bien compris, tu as une fonction lisse $f:\mathbf R^3\to M(\mathbf R^3)$ (vers les matrices $3\times 3$ à coefficients réels).

Le trick utile ici c’est de remarquer que $M(\mathbf R^3)$ (notation non usuelle, mais bien pratique sur un forum) est identifiable à $\mathbf R^9$. Tu as donc une fonction $f:\mathbf R^3\to\mathbf R^9$.

Ce qui va se passer dans la suite, c’est que je vais écrire du calcul à plusieurs variables sans jamais prendre en compte la possibilité d’une situation plus générale que $f:\mathbf R^n\to\mathbf R^m$, c’est-à-dire sans prendre en compte le cas des variétés. Mais si ça t’intéresse (ce qui est hautement probable) je veux bien en discuter après.

Donc pour un peu de généralité (et faire genre y a quelque chose de plus général que $n=3$ et $m=9$, alors que non) je considère $f:\mathbf R^n\to\mathbf R^m$ lisse (on dit aussi $C^\infty$). tu pourrais considérer $f$ de classe $C^r$ pour $r$ assez grand, ça marche pareil.

La série de Taylor que j’ai écrite tout à l’heure :

$$ f(a+h)= f(a) + df_a(h) + \frac 12 d^2f_a(h,h) +\dots $$

regardons les deux derniers termes. En particulier, ce qui t’intéresse, c’est la nature des objets $d f_a$ et $d^2f_a$.

Le premier,

$d f_a$ c’est la différentielle (classique) de $f$ au point $a$, c’est-à-dire l’application linéaire : $d f_a : \mathbf R^n\to \mathbf R^m$ qui, représentée par sa matrice dans les bases canoniques, a pour coefficients en $(i,j)$ :

$$ \frac{\partial f_i}{\partial x_j} $$

ce que (je penses) tu notes (avec des raisons bien fondées, dont je rediscute plus bas) $(d f_a)_{ij} .$

(Au passage, notons qu’ici $f_i$ désigne la fonction coordonnée en $i$ de $f$, c’est-à-dire l’application qui à $x\in\mathbf R^n$ associe la $i$-ème coordonnée de $f(x)\in \mathbf R^m$.)

Ainsi, $d f_a$ est représentable par une matrice (modulo le choix de deux bases, une pour $\mathbf R^n$ et l’autre pour $\mathbf R^m$). C’est pour ça que tu as envie de dire que c’est un machin de dimension $n\times m$.

Reste à préciser ce qu’on entend par $ df_a(h)$. Eh bien comme tu le sais sans doute (peut-être sans le savoir ?), c’est juste l’évaluation de l’application linéaire $d f_a$ en $h$ (qui est un vecteur de l’espace vectoriel $\mathbf R^3$).

Le second,

$d^2 f_a(h,h)$ est déjà moins sympathique à aborder, parce qu’il ne ressemble pas à une matrice. Sauf si $f$ était à valeurs dans $\mathbf R$, auquel cas ce serait la matrice hessienne.

Pour nous permettre de mieux voir l’objet, je te propose qu’on regarde cette application en ayant fait le choix des deux bases canoniques comme bases de nos espaces euclidiens.

Par définition,

$$ d^2f_a(h,h) = \sum_{i,j,k} \frac{\partial^2 f_i}{\partial x_j\partial x_k}h_jh_k e_i $$

avec $e_i$ les éléments de la base de $\mathbf R^m$.

Ainsi, tu obtiens un objet qui est encore linéaire sur chacune de ses entrées, pour peux que l’on distingue les deux $h$ dans $(h,h)$. (Est-ce que tu vois pourquoi ?)

Donc, même si ce n’est pas une application linéaire de $\mathbf R^n$ dans $\mathbf R^m$, tu as une application linéaire sur chacun des facteurs :

$$ d^2f_a : \mathbf R^n \times \mathbf R^n \to \mathbf R^m $$

ce qui équivaut (en prenant la base duale des $e_i$) à une application multilinéaire :

$$ d^2 f_a : \mathbf R^n \times \mathbf R^n \times (\mathbf R^m)^* \to \mathbf R $$

définie par :

$$ d^2 f_a(u,v,w) = \sum_{i,j,k} \frac{\partial^2 f_i}{\partial x_j\partial x_k}u_jv_k w(e_i) $$

(à noter ici que si $u,v$ sont des vecteurs de $\mathbf R^n$, en revanche $w$ est une forme linéaire sur $\mathbf R^m$, c’est-à-dire un vecteur du dual de cet espace : $(\mathbf R^m)^*$.)

Retour à la terminologie

Le fait que cette dernière application soit multilinéaire, c’est pour ça que tu as envie (c’est un « tu » impersonnel) de l’appeler tenseur. C’est un bon réflexe. Parce que le calcul s’en retrouve intelligemment écrit.

En effet, en écrivant $d^2 f_a$ comme un tenseur de coefficients $\alpha_{i,j,k}$, tu peux faire du calcul et raisonner beaucoup plus facilement, et avec toute la rigueur nécessaire. (Venant du fait que c’est une application multilinéaire.)

Ce qui fait qu’en tant que matheux (géomètre) ça me chiffonne, c’est parce qu’en géométrie on appelle tenseur des objets plus restreints que des applications multilinéaires. On demande à ce que l’espace vectoriel en jeu (lui et son dual) soit exclusivement l’espace tangent. Or ici, on a par exemple $\mathbf R^n$ et $\mathbf R^m$, qui ne sont pas identiques.

Au delà d’un problème de dimension (tu pourrais me dire que dans le cas $n=m$ y a plus de souci), la bonne caractérisation à avoir en tête c’est celle de $C^\infty$-linéarité. Cela dit par exemple que les champs de vecteurs sont effectivement des tenseurs. Mais en revanche, la dérivation n’en n’est pas un (à cause de la règle de Leibniz).

Du coup, tenseur ou pas ? Et bah je dirais que tant que tu ne fais pas de la géométrie, dis tenseur. C’est beaucoup plus malin. En revanche, si un jour tu as envie de faire ce travail sur des variétés (par exemple sur une sphère, un tore, etc.) tu ne pourras plus te servir de ça et il faudra faire de la géométrie. Cela vient du fait qu’on a énormément profité du fait que l’espace tangent à $\mathbf R^k$ est lui-même.

Est-ce que ça répond à tes questions ? Tu en as d’autres peut-être ? :-)

edit : à noter que j’ai pris toutes mes dérivées en $a$ :)

Édité par Holosmos

+3 -0
Banni

Ce qui, en y regardant de pas trop près, à une gueule de produit scalaire.

Oui, c’est une forme bilinéaire et les produits scalaires en sont des cas particuliers.

@Holosmos : Ok, j’allais te demander ce que tu appelles tenseur mais tu as suffisamment répondu dans ton message.

+0 -0
Auteur du sujet

C’est en effet beaucoup plus clair, donc un grand merci, et ça fait d’ailleurs deux fois que tu me sauves et que je me fait avoir avec le concept d’application (multi)linéaire. Je pense que je vais aller faire un tour chez mes amis physiciens et suivre un de leur cours à l’occasion, ça m’évitera des ennuis :)

#JeSuisToujoursArius • Doctorant et assistant en chimiedev' à temps partiel (co-réalisateur ZEP-12, recherche et template LaTeX)

+1 -0
Vous devez être connecté pour pouvoir poster un message.
Connexion

Pas encore inscrit ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte