Équilibre de Nash

Au coeur de la théorie des jeux, la notion d'équilibre de Nash

a marqué ce sujet comme résolu.

Tout le monde se secoue ! :D

J'ai commencé (il y a une heure) la rédaction d'un tutoriel au doux nom de « Équilibre de Nash » et j'ai dans l'objectif de proposer en validation un texte aux petits oignons. Je fais donc appel à votre bonté sans limite pour dénicher le moindre pépin, que ce soit à propos du fond ou de la forme. Vous pourrez consulter la bêta à votre guise à l'adresse suivante :

Merci !


Comme promis, je suis en train de faire un tuto sur l'équilibre de Nash. Ce tuto se veut accessible à un grand nombre pour ses deux premières parties (la dernière étant plus pour le côté puriste).

Actuellement :

  • il manque une partie dans laquelle je fais un exemple (ça viendra, ne vous inquiétez pas) ;
  • il me faut une relecture sur tout le reste.

Pour la relecture :

  • sur les deux premières parties il me faut des commentaires sur l'accessibilité du texte ;
  • remarques de fonds en priorité ;
  • remarque de forme aussi, le texte en place est pas censé bouger.
+0 -0

Coucou,

On a demandé un relecteur en science ? C'est parti !

Introduction générale

L'intro est rude. Avant même de parler de bonne stratégie, il faudrait parler de stratégie tout court.

Pour ce jeu, une bonne stratégie semble être de jouer une fois sur trois chacune des trois stratégies.

Lesquels trois ? De plus, jouer alternativement ou aléatoirement ne me semble pas spontanément être une bonne stratégie au pierre-feuille-ciseau. Spontanément, je dirai que si on n'a pas le droit de changer de stratégies en cours de route, il n'y a pas de bonne stratégie. Et si on a le droit (voilà l'équilibre qui pointe le bout de son nez), il faudrait peut-être le dire.

Bref, je trouve l'intro assez confuse.

À noter : il n'y a pas de conclusion générale.

Joueurs et stratégies

Dans notre jeu de pierre-feuille-ciseaux, on peut supposer que l'on a n=2 joueurs.

Tu supposes assez de truc comme ça. Pierre-feuille-ciseaux, tu prends, on a, on considère… deux joueurs. Évite d'alourdir la forme plus que nécessaire.

Je trouve les notations assez confuses. Les ai ne sont pas définis avant, et on ne sait toujours pas ce qu'est une stratégie. Jouer un coup (feuille, ciseau…), ou une méthode (jouer tout le temps feuille, alterner ciseau et caillou…).

En effet, on a bien envie que le gain d'un joueur

On a envie ou c'est une nécessité ?

À la fin de la partie, il manque quand même un truc. Les stratégies sont fixes, et ne dépendent pas de la stratégie adverse (jouer ciseau s'il a joué feuille au tour précédant ne rentre pas dans ton formalisme, alors que c'est un peu la base de as mal de stratégies). J'ai encore du mal à voir où tu veux en venir…

II Équilibre de Nash

ils vont chercher à optimiser leurs gains selon les stratégies des adversaires.

Tiens, mais voilà ma réflexion juste au-dessus qui pointe le bout de son nez, non ? Peut-être parler de ça plus tôt ?

En d'autres termes, l'équilibre de Nash dit que dans cette situation d'équilibre, connaître ou non les stratégies des adversaires ne change rien à sa façon de jouer (si on joue rationnellement et qu'on cherche à maximiser son gain).

En bon mathématicien, je me demande : cet équilibre existe-t-il toujours ? Est-il unique ? Je n'ai pas l'impression que je vais avoir une réponse à ces questions tout de suite (à voir dans la suite).

Dorénavant, on ne parlera plus de stratégie et de stratégie mixte comme dans le chapitre précédent, mais de stratégie pure (pour désigner les a∈A) et de stratégie (pour désigner les σ∈Δ). En effet, ce sont vraiment ces dernières qui seront utilisées par nos joueurs.

On ne change pas les notations ou les noms en cours de route. C'est déjà assez dur à suivre comme ça.

Ce sont les stratégies, σi, pour le joueur i qui exploitent la connaissance des stratégies des adversaires, que l'on notera σ−i (c'est-à-dire la donnée des σj pour j≠i).

Ainsi, étant donné les stratégies des joueurs adversaires à i, σ−i, on notera E(σ−i)∈Δi la stratégie exploitante du joueur i.

Les notations deviennent assez bordéliques.


Je préfère m’arrêter là. La bonne nouvelle, c'est qu'il n'y a rien de très compliqué jusqu'ici, la mauvaise, c'est que c'est très dur à suivre. OK, j'ai eu une sale journée et suis probablement assez fatigué, mais on est rapidement enseveli sous les nombreuses notations souvent assez proches qui désignent des objets souvent définis un peu approximativement. C'est quand tu as défini une stratégie non pure que j'ai compris que la précédente était pure, par exemple.

L'impression que ça donne, c'est que la façon dont tu voulais transmettre ce théorème à évoluer au fil de l'écriture, et que le retour en arrière (pour garder une cohérence globale) ne s'est pas fait comme il aurait dû.


En tout cas, le sujet semble accessible (pas de maths nécessitant une licence :D ), très intéressant et assez peu courant, au moins dans une version tout public.

+0 -0

Accessible ? non.

Le théorème lui-même est plaisant, mais j'ai failli aller chercher l'article sur Wikipédia pour avoir ce fameux théorème de Nash, tant la formulation du théorème lui-même tardait à venir.

Et finalement, je viens d'aller vérifier un point douteux sur Wikipédia : Tu écris : "une stratégie x est un équilibre de Nash ssi … … "

Non. Un équilibre de Nash n'est pas une stratégie, mais une situation dans laquelle toute stratégie bla bla…

Les 2 phrases suivantes (celles sans symboles mathématiques) définissent mieux l'équilibre de Nash.

Je n'ai pas le temps de répondre à tout et de faire les corrections mais, si, un équilibre de Nash c'est une stratégie mixte (dans la formulation que j'ai donnée ça veut dire la donnée des stratégies mixtes pour chaque joueur). J'ai l'article de Nash sous la main si besoin

Ça ne me paraît pas non plus intéressant de formuler le théorème sans avoir les outils pour l'écrire ....

J'ai lu uniquement la 1ére partie et je trouve ça super abrupte comme approche. Je ne sais pas quel publique tu vises, mais ça ne semble pas être le débutant.

Voici mes remarques :

  • Tu parles de classe de jeu sans expliquer ce qu'est un jeu ni même donner un exemple.
  • Si le but est de faire un tuto accessible, pourquoi partir sur des jeux compliqués avec une formalisation lourde ? Tu peux faire une première partie simple qui présente les concepts avec des exemples accessibles (dilemme du prisonnier, poule mouillée, chasse au cerf, etc.).
  • Tu pourrais parler des différentes représentations d'un jeu
  • Dans l'introduction je trouve que ça serait bien de parler des jeux à somme nulle et du théorème du minimax. Comme ça le lecteur peut comprendre d'où viennent les travaux de Nash.
  • D'ailleurs Nash à plus à voir avec Van Neumann qu'avec Smith et la main invisible.
  • Je ne prendrais pas pierre-feuille-ciseau comme exemple de jeu pour commencer car il n'y a pas d'équilibre en stratégie pure.
  • D’ailleurs tu n'explique pas ce qu'est une stratégie pure et une mixte.
  • Tu ne donne aucune explication sur la portée et l'utilité des équilibres de Nash. Pourtant c'est un outil central en économie et en biologie de l'évolution pour ne citer qu'eux. Pour l'économie si tu veux je peux te donner des exemples et illustrations afin d'aider le lecteur à voir comment ce concept peut aider à mieux comprendre le monde dans lequel il vit (régulation de la concurrence par exemple).
  • Tu ne parle pas des jeux simultanés/séquentielles ni des jeux répétés.

Tu devrais pour moi séparer ton article en deux grandes parties. Une première où tu explique le concept de jeu et d'équilibre de Nash ainsi que ses explications. Et une seconde partie où tu formalise le sujet et donne les démonstrations pour ceux qui veulent aller plus loin.

Non. Un équilibre de Nash n'est pas une stratégie

Un équilibre est plutôt un ensemble de stratégies, ce qu'il à défini comme un équilibre de Nash est la fonction de meilleure réponse d'un joueur. Et l'équilibre est défini quand chaque joueur est sur sa meilleure réponse. J'imagine que quand il dit "stratégie" il pense "ensemble de stratégies".

PS : Un exemple d'introduction intéressant, qui montre que les cochons se comportent la façon prédite par la théorie des jeux.

+0 -0

Je rejoins Demandred : une longue première partie, sans la moindre formule mathématique, sans lettre grecque, pour présenter le concept, avec différents exemples d'application. Puis pour les personnes intéressées, une deuxième partie facultative et plus mathématique.

Je voudrai revenir, à tête reposée, sur la structure générale.

Je la verrai bien la première partie ainsi :

  • définir ce qu'est un jeu (joueur + stratégies),
  • définir ce qu'est un joueur,
  • définir ce qu'est une stratégie pour un joueur, dire qu'il en existe plusieurs sortes (pures, mixtes, dépendant de la stratégie adverse…), quitte à ne pas aller dans le détail ici,
  • définir A, l'ensemble des stratégies du jeu,
  • définir les gains.

En agrémentant d'exemple au fur et à mesure.

Ensuite, tu fais une partie stratégies, dans laquelle tu détailles les différentes stratégies possibles (pure, mixte, exploitante).

Dans une troisième partie, tu parles d'équilibre de Nash. Ça arrive tard, mais si tu décris avec les mains le théorème dans l'intro générale, ça ne devra pas poser de problème.

Pour les notations, je te conseille d'écrire toutes les notations sur une feuille, vérifier qu'elles sont lisibles et cohérentes, et que ça fait moins d'une page A5, puis de t'y tenir, sans les modifier par la suite.

Édit : la manière que je propose n'est pas incompatible avec celle de Demandred/elegance, il suffit de remplacer 1ère partie par 1ère partie mathématique dans ma proposition.

+0 -0

Je suis totalement en accord avec les remarques et suggestions de Demandred. La théorie des jeux, c'est la branche typique des maths où on peut se permettre de cacher un peu le formalisme pour expliquer les choses en langue naturelle. Malheureusement, ce côté un peu intuitif fait qu'on lit beaucoup de bêtises sur Internet.

Là, tu proposes quelque chose de fondé, propre et essentiellement correct sur le plan mathématique, ce qui est remarquable. Le principal écueil de ton tutoriel provient de sa structure et du mauvais équilibre entre formalisme mathématique pour l'amateur éclairé d'une part et pur débutant d'autre part.

Gabbro (premier passage) :

Lesquels trois ? De plus, jouer alternativement ou aléatoirement ne me semble pas spontanément être une bonne stratégie au pierre-feuille-ciseau. Spontanément, je dirai que si on n'a pas le droit de changer de stratégies en cours de route, il n'y a pas de bonne stratégie. Et si on a le droit (voilà l'équilibre qui pointe le bout de son nez), il faudrait peut-être le dire.

À la fin de la partie, il manque quand même un truc. Les stratégies sont fixes, et ne dépendent pas de la stratégie adverse (jouer ciseau s'il a joué feuille au tour précédant ne rentre pas dans ton formalisme, alors que c'est un peu la base de as mal de stratégies). J'ai encore du mal à voir où tu veux en venir…

Ce que tu pointes est plus profond que tu ne le crois. C'est une difficulté assez importante dans cette activité de modélisation.

Demandred :

Tu parles de classe de jeu sans expliquer ce qu'est un jeu ni même donner un exemple.

Le but d'une introduction c'est pas forcément de donner tous les éléments de réponses, mais de questionner le public.

Si le but est de faire un tuto accessible, pourquoi partir sur des jeux compliqués avec une formalisation lourde ? Tu peux faire une première partie simple qui présente les concepts avec des exemples accessibles (dilemme du prisonnier, poule mouillée, chasse au cerf, etc.).

Ce sera un tutoriel de maths, pas d'économie ou de sciences sociales.

Dans l'introduction je trouve que ça serait bien de parler des jeux à somme nulle et du théorème du minimax. Comme ça le lecteur peut comprendre d'où viennent les travaux de Nash.

Ça contredit ton envie de simplifier l'introduction.

D'ailleurs Nash à plus à voir avec Van Neumann qu'avec Smith et la main invisible.

Et ? Je ne fais pas de cours d'épistémologie, j'ai juste introduit le théorème de Nash afin de montrer le pas philosophique qui a été fait.

Je ne prendrais pas pierre-feuille-ciseau comme exemple de jeu pour commencer car il n'y a pas d'équilibre en stratégie pure.

Je comprends pas l'argument.

D’ailleurs tu n'explique pas ce qu'est une stratégie pure et une mixte.

Si, c'est dit.

Tu ne donne aucune explication sur la portée et l'utilité des équilibres de Nash. Pourtant c'est un outil central en économie et en biologie de l'évolution pour ne citer qu'eux. Pour l'économie si tu veux je peux te donner des exemples et illustrations afin d'aider le lecteur à voir comment ce concept peut aider à mieux comprendre le monde dans lequel il vit (régulation de la concurrence par exemple).

J'ai aussi dit qu'une illustration arriverait plus tard.

Tu ne parle pas des jeux simultanés/séquentielles ni des jeux répétés.

Pas l'objectif.

Tu devrais pour moi séparer ton article en deux grandes parties. Une première où tu explique le concept de jeu et d'équilibre de Nash ainsi que ses explications. Et une seconde partie où tu formalise le sujet et donne les démonstrations pour ceux qui veulent aller plus loin.

Non, je veux faire un tutoriel de mathématiques. Même si ça paraît plus difficile, à mon avis c'est la seule manière pour traiter le sujet sans apprendre de bêtise. C'est suffisamment délicat avec le formalisme, alors sans on fait tout et n'importe quoi.

Un équilibre est plutôt un ensemble de stratégies, ce qu'il à défini comme un équilibre de Nash est la fonction de meilleure réponse d'un joueur. Et l'équilibre est défini quand chaque joueur est sur sa meilleure réponse.

C'est plus fin que ça. Il faut bien comprendre qu'il ne s'agit pas de trouver de meilleure réponse, mais de montrer que l'information sur les stratégies des autres joueurs n'apporte rien.

Gabbro deuxième passage :

J'ai pas l'impression que ta proposition soit très différente de ce que je fais.

Pour les notations, je te conseille d'écrire toutes les notations sur une feuille, vérifier qu'elles sont lisibles et cohérentes, et que ça fait moins d'une page A5, puis de t'y tenir, sans les modifier par la suite.

Où est-ce que mes notations ne sont pas cohérentes ?

Je suis totalement en accord avec les remarques et suggestions de Demandred. La théorie des jeux, c'est la branche typique des maths où on peut se permettre de cacher un peu le formalisme pour expliquer les choses en langue naturelle. Malheureusement, ce côté un peu intuitif fait qu'on lit beaucoup de bêtises sur Internet.

Et bien justement, je pense que sans formalisme mathématique on est confronté au problème de la langue. On a beaucoup de difficulté à énoncer précisément la notion d'équilibre de Nash sans l'appareil formel.

Si je dis simplement : « Un équilibre de Nash c'est lorsque aucun des joueur n'a d'intérêt à changer unilatéralement de stratégie » alors ma formulation sera correcte, mais sera mal interprétée ou lue par le public. Si je me contente de ça, certains comprendront « C'est la meilleure stratégie possible. ».

Où est-ce que mes notations ne sont pas cohérentes ?

« pas cohérente », ce n'est peut-être pas le bon bon terme, mais les $\sigma_{i}$ m'ont pas mal dérouté. Si $i$ est positif, c'est un joueur, mais je n'ai pas compris ce que ça signifiait si $i$ était négatif (c'est pour ça que je me suis arrêté à cet endroit là).

J'ai pas l'impression que ta proposition soit très différente de ce que je fais.

Pas très, en effet. Les trois grosses différences sont de mettre les stratégies pures, les stratégies mixtes et les stratégies exploitante ensemble, de définir ce qu'est une stratégie pour un joueur très tôt, ce que tu fais actuellement pas du tout, et d'énoncer le théorème avec les mains dans l'introduction générale (voire dans une partie propre, comme le conseil d'autre personnes).

+0 -0

Où est-ce que mes notations ne sont pas cohérentes ?

« pas cohérente », ce n'est peut-être pas le bon bon terme, mais les $\sigma_{i}$ m'ont pas mal dérouté. Si $i$ est positif, c'est un joueur, mais je n'ai pas compris ce que ça signifiait si $i$ était négatif (c'est pour ça que je me suis arrêté à cet endroit là).

Ok je vois de quoi tu veux parler. Bon si tu veux continuer ta lecture c'est juste une notation qui ressemble à ce qu'on fait quand on écrit $\hat{\sigma}_i$. En fait c'est le $(n-1)$-uplet $\sigma$ dans lequel on a retiré la composante en $i$.

Ce sera un tutoriel de maths, pas d'économie ou de sciences sociales.

Du coup je comprends mieux ton approche et les choix que tu fais. Je tique juste un peu sur le "accessible à un grand nombre" qui me fait sourire car on ne dois pas avoir la même définition de cette expression. :D

+0 -0

Ce sera un tutoriel de maths, pas d'économie ou de sciences sociales.

Du coup je comprends mieux ton approche et les choix que tu fais. Je tique juste un peu sur le "accessible à un grand nombre" qui me fait sourire car on ne dois pas avoir la même définition de cette expression. :D

Demandred

Oh tu sais, dès qu'on me dit :

(pas de maths nécessitant une licence :D )

Gabbro

Je fais péter le champagne !

+1 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte