Probabilité d'un dé à 6 faces du commerce

a marqué ce sujet comme résolu.

Bonjour à tous !

Lors d'un jeu basé sur le lancé de dé à 6 faces, je me suis demandé si la probabilité de tombé sur la face du dé que j'ai était bien de 1/6.

C'est un dé basique que l'on trouve en commerce avec des petits trous sur chaque faces pour indiquer le numéro. Mais le problème c'est que sur la face du 6 il y a beaucoup moins de matière que sur la face du 1 par exemple donc la masse du dé n'est pas uniforme sur l'emsemble du cube.

Donc mes questions sont :

  • Est-ce correct déjà ? (Je pense que oui)
  • Sur quelle face à t'ont le plus fe chance de tomber ? Instinctivement je dirait la face numéro 6, puisque si j'avais à piper un dé je me débrouillerai pour que la face 1 soit plus lourde que la face 6.
  • Pouvez vous m'indiquer des pistes pour prouver physiquement que c'est bien sur la face 6 qu'on a le plus de chance de tomber ?

Merci !

Tu peux écrire un bout de Python qui boucle et attend des chiffres et comptabilise, et quand il reçoit plus de chiffre c'est fini, il fait son calcul de fréquences et il t'affiche un joli histogramme avec matplotlib. Tu lances, tu tapes ton chiffre et tu continues comme ça un moment. Bon après-midi à lancer des dés :D

Probablement plus efficace, il y a la technique des casinos pour vérifier qu'un dé n'est pas truqué : tu le monte sur un axe sans le percer (par exemple via 2 sommets opposés) et tu le fais tourner rapidement selon cet axe.

Si le dé est pipé, il y aura du balourd pendant la rotation.

Dans le doute, tu peux recommencer avec un autre axe avec 2 autres sommets opposés.

Le gros avantage c'est que la technique est garantie de fonctionner sans biais statistique et très rapidement ; l'inconvénient est que l'outillage nécessaire à la mesure est plus compliqué.


PS : question à ceux qui font des stats à coup de lancé de dé : combien de lancés de dés faut-il pour avoir 95 % de certitude que le dé à 6 faces n'est pas pipé, si on considère que le dé est pipé à partir du moment où la valeur qui sort le plus souvent est tirée 10 % plus souvent que la valeur la moins fréquente ?

Ce calcul (que je ne sais plus faire sans me replonger dans mes cours de stats d'il y a 12 ans…) permettra de savoir si la méthode que vous proposez est faisable – on peut adapter le niveau de confiance et le seuil à partir duquel on considère un dé comme pipé.

Pour la réalisation d'un intervalle de confiance il faut que les conditions $n \geqslant 30$, $n \times f \geqslant 5$ et $n \times (1-f) \geqslant 5$ soient vraies avec $n$ le nombre de tirages et $f$ la fréquence observée. Il faut ensuite réaliser l'intervalle $[f - \frac{1}{\sqrt{n}} ; f + \frac{1}{\sqrt{n}}]$, si la probabilité $p$ (ici $\frac{1}{6}$ appartient à cet intervalle alors on considère que le dé n'est pas truqué au seuil de 95 %.

+0 -0

@thomas7643, d’où sortent le 30 et le 5 ?

Tu peux écrire un bout de Python qui boucle et attend des chiffres et comptabilise, et quand il reçoit plus de chiffre c'est fini, il fait son calcul de fréquences et il t'affiche un joli histogramme avec matplotlib. Tu lances, tu tapes ton chiffre et tu continues comme ça un moment. Bon après-midi à lancer des dés :D

Grimur

Bof, tant qu’on est dans l’automatisation, autant placer une caméra au dessus de la table branchée avec un logiciel de reconnaissance de formes qui va compter tout seul. On peut même faire en sorte que la table se penche pour faire tomber les dés avec tout un dispositif pour qu’ils se relancent tout seuls. Après une semaine de fonctionnement en autonomie, on devrait pouvoir exploiter les résultats…

+0 -0

Ce sont vraiment des quantités morales. On pourrait les multiplier par 5 que ça n'aurait pas plus de raison d'être.

L'idée c'est d'essayer de s'écarter de phénomènes ponctuels et avoir des moyennes. Mais bon, de toute façon pour caractériser une convergence c'est jamais évident.

@SpaceFox: Si au bout de 100 lancers, tu as obtenu 100 fois le même nombre, tu dois pouvoir conclure que le dé est pipé.

Si tu as 30 fois un chiffre, et 14 fois chacun des 5 autres, on commence à avoir une suspicion… mais il faut faire plus de lancers.

Si chacun des chiffre sort entre 16 et 17 fois, je pense (?) qu'on peut conclure que le dé n'est pas pipé.

Le nombre minimal de lancers n'est donc pas connu à l'avance.

+0 -5

@SpaceFox: Si au bout de 100 lancers, tu as obtenu 100 fois le même nombre, tu dois pouvoir conclure que le dé est pipé.

Si tu as 30 fois un chiffre, et 14 fois chacun des 5 autres, on commence à avoir une suspicion… mais il faut faire plus de lancers.

Si chacun des chiffre sort entre 16 et 17 fois, je pense (?) qu'on peut conclure que le dé n'est pas pipé.

Le nombre minimal de lancers n'est donc pas connu à l'avance.

elegance

Serious maths at work.

Non vraiment. La question de SpaceFox est très claire, et je suis curieux de la réponse. Si quelqu'un sait calculer ça, c'est chouette.

+0 -0

Pour la réalisation d'un intervalle de confiance

@Thomas7643 : La formule que tu donnes n'est pas celle d'un intervalle de confiance mais celle d'un intervalle de prévision. Tu considères ici que ton dés n'est pas truqué et tu regarde l'intervalle dans lequel arrive la fréquence dans 95% des cas. Mais tu ne peux rien en déduire sur le fait que ton dé soit pipé ou non si je ne dis pas de bêtise.

Pour répondre à la question : "combien de lancés de dés faut-il pour avoir 95 % de certitude que le dé à 6 faces n'est pas pipé, si on considère que le dé est pipé à partir du moment où la valeur qui sort le plus souvent est tirée 10 % plus souvent que la valeur la moins fréquente ?" Voici comment je ferais.

On cherche à avoir un intervalle de confiance de la fréquence observé à plus ou moins 10% de la fréquence théorique qui est 1/6. Ce qui veut dire qu'on cherche une largeur d'intervalle de $0.033$. Il suffit alors d'isoler $n$ dans la formule suivante étant donné qu'on connait la largeur de l'intervalle et le niveau de risque $\alpha = 0.5%$.

$$IC_{(1-\alpha)}(p) = \left[\overline{X} \pm Z_{(1-\frac{\alpha}2)} \sqrt{\frac{\overline{X}(1-\overline{X})}{n}}\right]$$

On trouvera ainsi un intervalle de confiance telle que la fréquence observée à 95% de chance d'être comprise entre plus ou moins 10% de la fréquence théorique. Il y aurai donc 95% de chance que le dés ne soit pas truqué.

Je vous laisse faire le calcul pour trouver $n$. :D

+0 -0

Tu n'as précisé presque aucune de tes notations, c'est incompréhensible en l'état.

Bon en fait, à chaque fois il s'agit de se ramener à une loi normale. Mais avant, il faut bien poser ce qu'on fait.

Disons que $X_n$ est la variable aléatoire qui vaut $1$ si je tombe sur 6 sur le $n$-ième tirage et $0$ sinon. En clair, $X_n$, modélise l'apparition de 6 au tirage $n$. Comme les $X_n$ sont indépendantes et identiquement distribuées, le théorème central limite me dit que :

$$ \left(\frac{X_1+X_2+\dots +X_n}{n}\right)_{n\in\mathbf{N}} $$

converge en loi vers l'espérance de $X_1$, $\mathbf{E}[X_1]$. De plus,

$$ \left(\frac{X_1+X_2+\dots +X_n}{\sqrt n}\right)_{n\in\mathbf{N}} $$

converge en loi vers la loi normale centrée et d'écart-type $\sigma^2$. Et $\sigma$ est la variance de $X_1$.

Ainsi, en notant $M_n = (X_1+X_2+\dots+X_n)/n$,

$$ \lim_{n\to +\infty} \mathbf{P} \left( x \in \left[ M_n - \frac{\alpha \sigma}{\sqrt{n}}, M_n + \frac{\alpha \sigma}{\sqrt{n}} \right] \right) = \frac{1}{2\pi}\int_{-\alpha}^{\alpha}e^{-y^2/2}\,{\rm d}y. $$

Et on sait, de plus, que pour $\alpha = 1.96$, le membre de droite (qui est égal au membre de gauche) est égal à 95%.

Maintenant, on a besoin d'un résultat qui permet de caractériser la convergence en $n$. Pour cela on a une inégalité (j'en connais pas de meilleure), qui est la suivante. Elle semble être due à Berry-Esseen, on garde les mêmes notations qu'au-dessus et on note $\mu$ la moyenne théorique recherchée.

$$ \sup_{\alpha\in \mathbf{R}} \left|\mathbf{P}\left(\frac{\sqrt{n}}{\sigma}\left(\frac{X_1+X_2+\dots+X_n}{n} - \mu\right)\leq \alpha\right) - \frac{1}{2\pi}\int_{-\infty}^{\alpha}e^{-y^2/2}\,\mathrm{d}y \right| \leq \frac{3\mathbf{E}[|X_1-\mu|^3]}{\sigma^3 \sqrt{n}}.$$

Tout cela signifie que la convergence est en $O(1/\sqrt{n})$. Donc pour avoir une précision de $10%$ il faut l'ordre de $n=100$ tirages. Pour avoir le comportement exact, il faut pousser les calculs avec la formule précédente.

Le $3$ semble être une mauvaise approximation, apparemment (d'après les wiki) des valeurs comme $0.5$ sont correctes.

+1 -0

Tu peux le prouver en faisant un grand nombre de tirages et avec un test statistique.

Holosmos

Est-ce qu'un tel test statistique constitue vraiment une preuve ? Ce n'est pas une question pour tatillonner, c'est une réelle question que je me pose.

+0 -0
Banni

Pour la question de SpaceFox, je vais tenter une approche un peu élémentaire et bourrine. Je sais pas trop si ça peut se faire, mais l'idée est que l'on exprime la probabilité d'obtenir certaines fréquences avec un certain nombre de lancers en sachant les probabilités de tomber sur chacune des faces.

Soit $n$ le nombre de faces. On note $C(a_1,\dots,a_m)$ le coefficient multinomial $\frac{(a_1+\cdots+a_m)!}{a_1!\cdots a_m!}$. Si on note $P$ le n-uplet des probabilités des faces et $K$ le n-uplet des nombres de résultats obtenus pour chaque face en faisant un certain nombre de lancers, on a $P(K=(k_1,\dots,k_n) | P=(p_1,\dots,p_n)) = C(k_1,\dots,k_n){p_1}^{k_1}\cdots{p_n}^{k_n}$.

Bref, en fait c'est pas des probabilités mais des densités de probabilités (bien que ça puisse peut-être s'unifier, j'en sais rien). C'est pas rigoureux.

Grâce à ça on peut calculer ce que doit être la probabilité restreinte à $P$, on se rend compte que c'est uniforme, indépendamment de n. edit Bon, heu, je sais pas comment j'ai fait pour trouver ça, j'ai dû faire n'importe quoi. Bref, on peut le supposer par la suite.

Ensuite, on calcule $P(P=(p_1,\dots,p_n) | K=(k_1,\dots,k_n))$ (densité de probabilité en fait). On devrait trouver $C(n-1,k_1+\cdots+k_n){p_1}^{k_1}\cdots{p_n}^{k_n}$.

Ça repose sur l'égalité

$$\int C(k_1,\dots,k_n) {x_1}^{k_1}\cdots {x_n}^{k_n} = \frac{1}{C(n-1,k_1+\cdots+k_n)}$$
que j'ai juste conjecturée. L'intégrale est prise sur les $x_i$ positifs dont la somme est $1$, et normalisée pour que l'intégrale de 1 soit 1.

Donc au fur et à mesure qu'on lance les dés, ça donne certaines probabilités pour les probabilités de tomber sur les faces. On lance jusqu'à ce qu'on ait une probabilité qui nous convienne. Il faut trouver le domaine sur lequel intégrer…


À vrai dire, je comprends pas vraiment le sens de ma propre approche. Sans rien lancer on a déjà une loi uniforme… [edit: Oui, j'ai fait n'importe quoi. On doit supposer une certaine probabilité sur P a priori, ce qui est normal, ouf !]

Ça me fait penser à des calculs de probabilités du genre la vie dans l'espace : je sais pas trop ce qu'on calcule en fait (enfin, on modélise avec des espaces de probas, ok, mais la correspondance avec la réalité m'embrouille). [je viens de voir la réponse de Au, c'est un peu la même interrogation je pense]

Et puis c'est peut-être bien trop bourrin, inexploitable.

+0 -0

À vrai dire, je comprends pas vraiment le sens de ma propre approche.

Tu n'es pas le seul si ça te rassure ! :D

Tu n'as précisé presque aucune de tes notations, c'est incompréhensible en l'état.

J'avoue que j'avais un peu la flemme et que j'ai balancé le truc un peu comme ça, honte à moi ! Merci à toi d'avoir pris le temps de donner une réponse plus détaillée de comment on trouve la formule de l'intervalle de confiance et des hypothèses associées. :)

+0 -0
Banni

@Demandred : Oui, ne cherchez pas, il faut évidemment supposer une certaine loi sur P avant (en regardant mon brouillon, j'ai prouvé qu'il y avait une loi uniforme en reprenant une équation qui le supposait). Par contre ce qu'on trouve n'est pas moche, donc ça vaut quand même le coup.

+0 -0

Est-ce qu'un tel test statistique constitue vraiment une preuve ?

Non, par ce que tu ne peux pas "prouver" mathématiquement que ce dé n'est pas truqué de la même façon que tu peux prouver le théorème de Pythagore. Si ton test te dis que ton dés n'est pas truqué à 99.99999% c'est "presque" comme si tu l'avais prouvé tu vois ce que je veux dire ? On n'est pas sur à 100% mais on fait comme si car on est vraiment proche (et pis on ne peut faire mieux de toute façon !).

D'où l'abus de langage qu'on s'autorise en parlant de "prouver" que le dés n'est pas truqué même si fondamentalement ce n'est pas une vraie preuve.

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte