La probabilité d'être élu

a marqué ce sujet comme résolu.
Banni

Bonsoir,

Suite à la discussion ayant débuté avec ce message de @Demandred, je me pose une question. Demandred donne un lien vers cette page, qui contient lui-même un lien vers cette autre page. Je cite le titre du deuxième lien :

Hillary Clinton has an 85% chance to win.

On trouve le même genre d’affirmation dans le premier lien. J’ai toujours cru que les sociétés de sondages se contentaient d’estimer les proportions de votes, avec un minorant (valable pour tout paramètre du modèle) de la probabilité que l’intervalle donné (qui est la variable aléatoire) contienne la bonne valeur. Et en supposant tout plein de trucs qui ont l’air difficiles à faire (qu’on ait tiré les sondés uniformément, notamment).

Mais de quelle probabilité est-ce qu’on parle ici ? Ce 85% est la probabilité de quoi dans quel espace de probas ? Je voudrais juste une grosse simplification, pas tous les détails. Je n’ai pas réussi à comprendre en survolant les liens de Demandred (désolé, je n’ai pas tout lu). Ils établissent un modèle basé sur l’historique de l’évolution des proportions de votes estimées ? J’ai beau taper tous les mots clefs que je trouve, je ne trouve rien, aucune explication théorique de ce que c’est. Sur cette page, ils disent qu’ils expliquent mais c’est bien trop flou et il n’y a aucune référence.

Autre question parallèle : pour quelle audience ce genre d’article est écrit ? Ce sont des gens qui ont une formation leur permettant de comprendre ? Ou alors c’est évident et je ne comprends pas ?

Merci d’avance.

edit : C’est de l’inférence Bayésienne ?

+0 -0

C’est quoi ce 85% ?

A mon avis, la réponse est dans ce que tu évoques. Je vais formuler mon message comme si l’élection était au suffrage direct. Les sondages prédisent 45.9% des voix Pour H.Clinton, et 42.8% Pour D.Trump. Mais comme tu le dis, il y a des marges d’erreur autour de ces prévisions.

Usuellement, on exprime les marges d’erreurs avec un seuil de 95% : Clinton ressort à 45.9%, avec une marge d’erreur de 2 points par exemple. Ca veut dire quoi ? Ca veut dire que la probabilité que Clinton sorte entre 45.9–2 et 45.9+2 est de 95%.

Les sondeurs français ont l’obligation de publier cette marge d’erreur.

On connait les marges d’erreur à 95%, C’est le seuil qu’on publie généralement, mais on peut tout aussi bien calculer les seuils à 90% ou à 85%.. et 70%

Ici, si ils arrivent à : Clinton à 70% de chances d’être entre 45.9–1.55 et 45.9+1.55, alors elle a :

  • 15% dêtre en dessous de 45.9–1.55
  • 70% d’être dans l’intervalle en question
  • et 15% d’être au dessus de 45.9+1.55

Donc 85% d’être au dessus de 44.35

Donc 85% de chances d’avoir plus que Trump, puisque le cumul Trump + Clinton est estimé à 88.7

C’est donc une autre formulation de la marge d’erreur.

C’est mon interprétation, je ne mettrais pas ma main à couper. Et je pense que c’est plus précisément : 'Clinton a 85% de chances d’obtenir plus de voix que Trump' (voix des électeurs, et non voix des grands-électeurs). Et effectivement, elle a obtenu plus de Voix que Trump.

Banni

Merci @elegance. Lorsqu’on donne un intervalle de confiance à 95%, cette probabilité correspond à la probabilité minimale que l’intervalle contienne le paramètre avant d’effectuer le test. Une fois que le test est effectué et qu’on a notre intervalle fixé, il n’est pas question de la "probabilité que l’intervalle obtenu contienne le paramètre". C’est ça qui empêche d’effectuer un test statistique, puis d’ensuite décider de ce qui a été testé.

Pour pouvoir parler de la probabilité que le paramètre soit quelque part, il faut de toute manière une loi sur les valeurs possibles du paramètre.

Mais j’ai trouvé, c’est de l’inférence bayésienne qui est faite. Je posterai des liens quand je pourrai.

Mais de quelle probabilité est-ce qu’on parle ici ? Ce 85% est la probabilité de quoi dans quel espace de probas ?

Il ne s’agit pas d’un sondage mais d’un modèle de prédiction électorale. Voici un lien qui présente les grandes lignes de sa démarche.

Autre question parallèle : pour quelle audience ce genre d’article est écrit ?

Le blog de Nate Silver est plus ou moins pour tout le monde, mais maintenant il y a plusieurs auteurs qui écrivent dessus je crois. La plupart des articles me semblent accessibles, et certains sont parfois un peu plus avancés/techniques que d’autre.

Silver à aussi écrit un livre très intéressant, que je suis actuellement en train de lire. Là aussi c’est très grand public par contre.

edit : C’est de l’inférence Bayésienne ?

Yep, Silver est un grand fan du Bayésianisme si ne raconte pas de bêtises !

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte