Présidentielles 2017

Débat sur les candidats

a marqué ce sujet comme résolu.

Note : sir Terry Pratchett n’a pas perdu sa noblesse en quittant notre monde.

(Et c’est peut-être bien le seul sir au titre duquel je tiens ! Quoique, sir Sean Connery…)

+0 -0

Pour rester dans le HS :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
$ curl -I https://zestedesavoir.com
HTTP/1.1 200 OK
Server: nginx
Date: Fri, 21 Apr 2017 23:24:27 GMT
Content-Type: text/html; charset=utf-8
Connection: keep-alive
Vary: Accept-Encoding
Vary: Cookie
Strict-Transport-Security: max-age=63072000; includeSubDomains; preload
X-Xss-Protection: 1
X-Content-Type-Options: nosniff
X-Frame-Options: SAMEORIGIN
P3P: CP="ALL DSP COR PSAa PSDa OUR NOR ONL UNI COM NAV"
Strict-Transport-Security: max-age=15768000
X-Clacks-Overhead: GNU Terry Pratchett

Paul McCartney et Tim Berners-Lee aussi quand même :p

Nan en vrai on s’en fout des titres de noblesse…

bricabrac

Nan on s’en fout pas. Vu comme la bourgeoisie se démène pour l’avoir (Fernand Braudel parlait de trahison [de classe]), un peu de respect ! Et puis, avant, ça permettait l’exonération d’impot !

+0 -0

Je suis à peu près persuadé que l’article que tu présentes s’appuie sur des techniques qui ne sont pas valables dans le cas des sondages, notamment à cause des redressements, justement. À croiser avec cet autre article sur le sujet.

Typiquement, il se sert du χ² pour vérifier que ce sondages correspondent bien à une loi de probabilité… sur une variable qui n’est pas aléatoire de deux manières différentes (sondage par quotas et non au hasard, plus redressements pour tenter de corriger les erreurs de mesure, ce qui a d’autre effets mais pas ceux discutés dans ton article).

La seule question intéressante est de savoir si la graine $\omega$ tiré par Dieu (?) dans l’ensemble possible $\Omega$ fait partie de ces graines qui fait que la trajectoire obtenue par le processus stochastique univers sous-jacent fait que Poutou est élu. Tout le reste n’est que futilités et bassesses.

Je suis à peu près persuadé que l’article que tu présentes s’appuie sur des techniques qui ne sont pas valables dans le cas des sondages, notamment à cause des redressements, justement. À croiser avec cet autre article sur le sujet.

Ce qui me choque aussi c’est l’interprétation de la p-value qu’il donne : "La probabilité que les scores d’Emmanuel Macron aient été aussi réguliers ces six dernières semaines soit dû au hasard est de 0.001 %.". C’est une erreur assez grave de dire ça, c’est typiquement le genre de truc à ne PAS dire. La seule chose qu’on peut dire c’est : si on considère que notre hypothèse nulle est vérifiée (ce qui est discutable comme le remarque SpaceFox) ALORS la probabilité d’obtenir le résultat effectivement observé est de 0.001%.

C’est une probabilité conditionnelle, utiliser la p-value comme "preuve" d’une hypothèse en oubliant son caractère conditionnelle est erreur assez embêtante pour quelqu’un qui fait des stats je trouve. Surtout si on s’adresse au grand public, on donne un caractère de vérité à notre proposition qui est loin de refléter la vérité.

+0 -0

Il manquait un point d’interrogation à la fin du lien. Je l’ai mis ici car justement je doutais de sa méthode… En tout cas il ne prouve rien, et c’est bien pour ça que j’ai parlé d’explication.

Saroupille

Attention, ce n’est pas parce que l’explication qu’il donne en langage naturel est très douteux comme le fait remarquer Demandered, que les conclusions ou la méthode est fausse (et ça reste toujours mille fois mieux que Samuel Laurent et son équipe des Décodeurs qui ne savent pas ce qu’est un décile et sont hargneux et insultants sur Twitter quand on leur fait remarquer).

Pour enfoncer le clou sur l’interprétation en langage courant:

"Ce qui veut dire qu’on est certain à 95 % que le vrai score mesuré est compris entre 17,3 % et 22,7 % (+/- 2,7 %)."

Ce n’est pas ce que cela veut dire. Le vrai score n’est pas aléatoire (même si on peut jouer sur les mots et dire qu’elle est issue d’une variable aléatoire de mesure ponctuelle sur le vrai score). C’est l’intervalle qui l’est. Et donc techniquement, si l’on devait tirer $n$ fois l’intervalle, on aurait 5% de probabilité que l’intervalle construit ne contienne pas la valeur exacte. Ici, il dit que c’est le score est la réalisation d’une VA qui a une probabilité de 95% d’être dans l’intervalle qu’il considère comme non-aléatoire.

A partir de là, "Ce qui veut dire qu’à long terme, 68 % de tous les sondages réalisés vont être compris dans un intervalle de +/- 1,35 %." est également faux et tout le travail qui en découle.

Je ne suis pas d’accord avec SpaceFox pour ne pas considérer la variable comme aléatoire. Elle n’a simplement pas la même loi et pas le même univers (et peut-être que cet univers n’est pas une bonne approximation de l’univers réel), mais elle reste aléatoire. Certe, l’échantillon ne l’est pas (enfin pas dans les proportions des différentes classes) mais la quantité à estimer qui est la part de vote dans la population toute entière l’est. La comparaison à faire serait entre l’estimation par Monté-Carlo et Quasi-Monté-Carlo: la seconde utilise une suite à forte discrépance pour faire une meilleure (plus rapide en fait mais ça revient au même puisque tout ça n’est qu’une histoire de convergence du TCL) estimation d’une quantité aléatoire.

De toute manière l’auteur sur-interprète à peu près tout, surtout lorsqu’il dit "les sondeurs répètent ce que disent les autres, et refusent de publier des résultats trop osés. C’est le herding dont je parlais tout à l’heure. Et dans la période d’incertitude sans précédent qu’a été la fin de cette campagne, les sondeurs ont apparemment paniqué, et cette pratique s’est amplifiée."

Ou alors leur méthode de sélection des échantillons sont tellement similaires qu’il donne les même résultats. Pas besoin de paniquer. :-)

EDIT: j’ai pris un peu trop littéralement le ’pas aléatoire’ de Spacefox je pense. Je suis d’accord que les deux facteurs qu’il donne fait diminuer les écarts types entre les résultats des divers sondages mécaniquement.

+1 -0

Les sondages donnent des résultats anormalement stables ?

Je pense que l’explication est donnée par les sondeurs eux-mêmes, quand on consultent leur méthodologie : notice méthodo

On y voit 2 choses :

  • nombre d’interviewés 2850 … c’est un peu plus que 1000, je ne me souviens plus ce qu’on gagne en précision en multilpliant l’échantillon par 3, mais je crois que ce n’est pas neutre.

  • et surtout : inteviews réalisées entre le 18 et le 21 avril. Quand on publie un sondage tous les jours et que chaque sondage est calculé sur des interviews réalisées soit le jour même, soit la veille, soit 2 jours avant, soit 3 jours avant, il y a une conclusion qui est à peu près évidente, c’est que les 750 interview réalisées le jour J servent pour le sondage publié le jour J, mais aussi pour les sondage J+1 , J+2 et J+3.

Du coup, la variabilité s’en trouve nettement réduite. Pas la peine d’aller chercher plus loin.

Eventuellement, en plus de cela, il est possible que les instituts s’inspirent un peu des résultats publiés par le voisin pour corriger leurs chiffres. On ne peut pas l’affirmer, mais on ne peut pas l’exclure.

  • nombre d’interviewés 2850 … c’est un peu plus que 1000, je ne me souviens plus ce qu’on gagne en précision en multilpliant l’échantillon par 3, mais je crois que ce n’est pas neutre.

La convergence du TCL est en $\sqrt n$$n$ est la taille de l’échantillon.

  • et surtout : inteviews réalisées entre le 18 et le 21 avril. Quand on publie un sondage tous les jours et que chaque sondage est calculé sur des interviews réalisées soit le jour même, soit la veille, soit 2 jours avant, soit 3 jours avant, il y a une conclusion qui est à peu près évidente, c’est que les 750 interview réalisées le jour J servent pour le sondage publié le jour J, mais aussi pour les sondage J+1 , J+2 et J+3.

Il est question de la variabilité entre les instituts de sondages, pas entre les sondages des jours $J$ et $J+1$. Ton raisonnement ne tient que si la base des sondés est commune à tous les instituts (ce qui me semble n’est pas le cas, quelqu’un confirmera).

+0 -0

La convergence du TCL est en n−−√ où n est la taille de l’échantillon.

C’est ça qui est beau avec les sondages : on ne sait pas trop vers quoi ça converge, mais on sait au moins à quelle vitesse on y va. :D

+0 -0

Aujourd’hui, premier tour d’une élection qui en compte en vérité 5. Les deux premiers pour élire un président, les deux suivant pour élire une assemblé, et le dernier au suffrage indirect pour la nomination d’un président de l’assemblé, d’un premier ministre et d’un gouvernement.

On se focalise beaucoup sur les deux premiers, mais je suis prêt à parier qu’aucune majorité ne se dégagera. Imaginez-vous vraiment un pôle avoir la moitié des sièges, sachant qu’il y a 5 pôles (autant le PS est grillé pour les présidentielles, autant il peut encore faire un bon score aux législatives) ? Et quand bien même une majorité se dégagerait, serait-elle compatible avec le président élu ?

Le 5e tour dépendra des 4 précédents, et tout peut arriver.

+0 -0

On se focalise beaucoup sur les deux premiers, mais je suis prêt à parier qu’aucune majorité ne se dégagera. Imaginez-vous vraiment un pôle avoir la moitié des sièges, sachant qu’il y a 5 pôles (autant le PS est grillé pour les présidentielles, autant il peut encore faire un bon score aux législatives) ? Et quand bien même une majorité se dégagerait, serait-elle compatible avec le président élu ?

Gabbro

Je suis tout à fait d’accord avec toi ! On oublie un peu trop les législatives à mon goût. De plus, si il y a une cohabitation, il y a très peu de chance que le programme sur lequel le président a été élu soit appliqué, non ? Enfin, encore moins que sans la cohabitation…

D’ailleurs, si les sondages disent vrais, sauf un duel Macron-Fillion, on connait le futur président ce soir aussi, non ?

D’ailleurs, si les sondages disent vrais, sauf un duel Macron-Fillion, on connait le futur président ce soir aussi, non ?

Heu… Même Macron-Fillon. En gros, la tendance c’est de dire : Macron gagne contre tous, Mélenchon contre tous sauf Macron, Le Pen contre aucun et Fillon seulement contre Le Pen.

Après, ne pas oublier qu’il y a deux semaines entre le 1er et le 2e tour, et les sondages n’ont pas de valeur prédictive (état de l’opinion à un instant t, pas t+14j).

+2 -0

Après, ne pas oublier qu’il y a deux semaines entre le 1er et le 2e tour, et les sondages n’ont pas de valeur prédictive (état de l’opinion à un instant t, pas t+14j).

Gabbro

Oui, mais il me semblait que sur beaucoup de duels l’écart était tout de même assez important comparé aux années précédentes.

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte