Probabilité d'un dé à 6 faces du commerce

a marqué ce sujet comme résolu.
Banni

Ok, en fait le principe c'est qu'on ne connaît pas la loi, mais quelle qu'elle soit, avec une certaine méthode pour l'estimer, on a une certaine probabilité minimale de bien l'estimer ?

+0 -0

Tu peux le prouver en faisant un grand nombre de tirages et avec un test statistique.

Holosmos

Est-ce qu'un tel test statistique constitue vraiment une preuve ? Ce n'est pas une question pour tatillonner, c'est une réelle question que je me pose.

Au

Preuve au sens scientifique. De toute façon, dans l'idéal théorique on aurait du presque-sûrement.

J'avoue que j'avais un peu la flemme et que j'ai balancé le truc un peu comme ça, honte à moi ! Merci à toi d'avoir pris le temps de donner une réponse plus détaillée de comment on trouve la formule de l'intervalle de confiance et des hypothèses associées.

Bah j'ai fait un peu mieux. J'ai répondu à la question de Spacefox.

Non, par ce que tu ne peux pas "prouver" mathématiquement que ce dé n'est pas truqué de la même façon que tu peux prouver le théorème de Pythagore. Si ton test te dis que ton dés n'est pas truqué à 99.99999% c'est "presque" comme si tu l'avais prouvé tu vois ce que je veux dire ?

Demandred

Pour le lolz : deuxième théorème d'incomplétude = on est même pas sûrs que le théorème de Pythagore est vrai.

La question de Spacefox est mal posee puisqu'il manque une donnee essentielle a fixer a priori : la marge d'erreur $m$ que l'on prendra a 0.01 pour l'exemple (c'est a mettre en rapport avec $p$ la valeur theorique de l'esperance de faire un $6$).

Partant de l'estimation classique d'une proportion sous niveau de confiance $\alpha$, on obtient ce qu'Holosmos a ecrit, c'est a dire l'intervalle de confiance $p \in [ \bar p \pm z_{1-\frac{\alpha}{2}}\sqrt{\frac{p(1-p)}{N}}]$.

Comme on souhaite respecter cet intervalle de confiance, on va calculer la marge d'erreur de sorte a rester dans celui-ci, c'est a dire de sorte que $m = z_{1-\frac \alpha 2}\sqrt{\frac{p(1-p)}{N}}$. De la, on deduit: $N = z_{1-\frac \alpha 2}^2\frac{p(1-p)}{m^2}$.

On connait la proportion a priori de $p = \frac 1 6$ et nous donne donc pour $N$ la valeur de $\frac{3.8416 * \frac 5 {36}}{0.0001}$ soit environ $5336$ arrondi a l'unite. Evidemment, $N$ evolue de maniere quadratique en l'erreur $m$. L'interpretation est la suivante : si apres $5336$ lances, la proportion de $6$, i.e. $\bar p$, n'est pas dans $[p \pm m]$, tu peux rejeter l'hypothese nulle selon laquelle les deux proportions sont identiques (avec le seuil de 95%): ton de est truque.

+1 -0

C'est très probable qu'il manquait des bouts à ma question, j'ai pas touché aux stats depuis plus de 10 ans.

Le but de ma remarque était surtout de montrer qu'une technique à priori simple (lancer un dé pour déterminer s'il est pipé) pouvait avoir des implications plus complexes qu'imaginées en premier abord.

Quand je disais "mal posee" c'etait au sens de Hadamard. Si l'on ne fixe pas le seuil d'erreur a priori, le probleme n'a pas qu'une solution. Il faut egalement fixer la vraie probabilite $p$ a priori, mais dans notre cas on sait que c'est $\frac 1 6$, l'experience etant tres simple et parfaitement controlee (c'est une des difficultes des sondages que de fixer un prior).

On peut refaire le calcul de maniere plus generale que dans le cas d'une proportion mais cela peut devenir complique, notamment si l'on ne dispose pas de la variance qu'il faudra alors estimer. Cela fait des calculs beaucoup moins simples et on a souvent recours a des approximations bien plus grossieres que dans le cadre de l'estimation de proportion.

Un dernier point. Tous nos calculs ont ete fait de maniere asymptotique, notamment l'intervalle de confiance. Or, si l'on s'autorise une marge d'erreur a 5%, on trouve $N = 64$ si je ne me plante pas. Autrement dit, selon les applications on peut ne pas etre dans ce que l'on pourra qualifier d'asymptotique.
Dans ce cas la, on peut utiliser des inegalites de concentration permettant d'obtenir des bornes non-asymptotiques (donc plus laches).

En particulier, avec Hoeffding et dans notre exemple de loi binomiale, on trouve directement $\forall \epsilon > 0, ~ P(| \bar X - p| \geq \epsilon ) \leq 2e^{-2n\epsilon^2}$.

On peut interpreter cela comme le fait que la probabilite de s'eloigner de la probabilite theorique d'au plus $\epsilon > 0$ decroit de maniere exponentielle en $n$.

Si comme plus haut, on prend $m=0,01$ et notre $N = 5336$, alors $\forall \epsilon > 0, ~ P(| \bar X - p| \geq 0.01 ) \leq 0.688$, donc vraiment moins bien que le calcul asymptotique (mais plus 'vrai').

Incroyable n'est-ce pas?

+1 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte