Coucou,
On a demandé un relecteur en science ? C'est parti !
Introduction générale
L'intro est rude. Avant même de parler de bonne stratégie, il faudrait parler de stratégie tout court.
Pour ce jeu, une bonne stratégie semble être de jouer une fois sur trois chacune des trois stratégies.
Lesquels trois ? De plus, jouer alternativement ou aléatoirement ne me semble pas spontanément être une bonne stratégie au pierre-feuille-ciseau. Spontanément, je dirai que si on n'a pas le droit de changer de stratégies en cours de route, il n'y a pas de bonne stratégie. Et si on a le droit (voilà l'équilibre qui pointe le bout de son nez), il faudrait peut-être le dire.
Bref, je trouve l'intro assez confuse.
À noter : il n'y a pas de conclusion générale.
Joueurs et stratégies
Dans notre jeu de pierre-feuille-ciseaux, on peut supposer que l'on a n=2 joueurs.
Tu supposes assez de truc comme ça. Pierre-feuille-ciseaux, tu prends, on a, on considère… deux joueurs. Évite d'alourdir la forme plus que nécessaire.
Je trouve les notations assez confuses. Les ai ne sont pas définis avant, et on ne sait toujours pas ce qu'est une stratégie. Jouer un coup (feuille, ciseau…), ou une méthode (jouer tout le temps feuille, alterner ciseau et caillou…).
En effet, on a bien envie que le gain d'un joueur
On a envie ou c'est une nécessité ?
À la fin de la partie, il manque quand même un truc. Les stratégies sont fixes, et ne dépendent pas de la stratégie adverse (jouer ciseau s'il a joué feuille au tour précédant ne rentre pas dans ton formalisme, alors que c'est un peu la base de as mal de stratégies). J'ai encore du mal à voir où tu veux en venir…
II Équilibre de Nash
ils vont chercher à optimiser leurs gains selon les stratégies des adversaires.
Tiens, mais voilà ma réflexion juste au-dessus qui pointe le bout de son nez, non ? Peut-être parler de ça plus tôt ?
En d'autres termes, l'équilibre de Nash dit que dans cette situation d'équilibre, connaître ou non les stratégies des adversaires ne change rien à sa façon de jouer (si on joue rationnellement et qu'on cherche à maximiser son gain).
En bon mathématicien, je me demande : cet équilibre existe-t-il toujours ? Est-il unique ? Je n'ai pas l'impression que je vais avoir une réponse à ces questions tout de suite (à voir dans la suite).
Dorénavant, on ne parlera plus de stratégie et de stratégie mixte comme dans le chapitre précédent, mais de stratégie pure (pour désigner les a∈A) et de stratégie (pour désigner les σ∈Δ). En effet, ce sont vraiment ces dernières qui seront utilisées par nos joueurs.
On ne change pas les notations ou les noms en cours de route. C'est déjà assez dur à suivre comme ça.
Ce sont les stratégies, σi, pour le joueur i qui exploitent la connaissance des stratégies des adversaires, que l'on notera σ−i (c'est-à-dire la donnée des σj pour j≠i).
Ainsi, étant donné les stratégies des joueurs adversaires à i, σ−i, on notera E(σ−i)∈Δi la stratégie exploitante du joueur i.
Les notations deviennent assez bordéliques.
Je préfère m’arrêter là. La bonne nouvelle, c'est qu'il n'y a rien de très compliqué jusqu'ici, la mauvaise, c'est que c'est très dur à suivre. OK, j'ai eu une sale journée et suis probablement assez fatigué, mais on est rapidement enseveli sous les nombreuses notations souvent assez proches qui désignent des objets souvent définis un peu approximativement. C'est quand tu as défini une stratégie non pure que j'ai compris que la précédente était pure, par exemple.
L'impression que ça donne, c'est que la façon dont tu voulais transmettre ce théorème à évoluer au fil de l'écriture, et que le retour en arrière (pour garder une cohérence globale) ne s'est pas fait comme il aurait dû.
En tout cas, le sujet semble accessible (pas de maths nécessitant une licence ), très intéressant et assez peu courant, au moins dans une version tout public.