Corondar a écrit:Quelle loi normale ? En quoi des biais d'échantillonnages s'uniformiseraient ou disparaitraient par une moyenne (qui au contraire ne fait que juxtaposer des marges d'erreur entre elles) ? Si vous prenez des sondages avec des marges d'erreur comprises entre 3 et 5, je ne vois guère comment vous arrivez à 2.5... 2.5 est en l'occurrence une marge d'erreur très basse, surtout selon les standards US.
Je crois que vous confondez (mais vous n'êtes pas le seul) biais et marge d'erreur. Pour résumer, si sur dix sondages publiés, tous donnent le même résultat, par exemple 45% pour un candidat, alors que le résultat réel est 48%, même si la marge d'erreur est de 3,2 points et que tous les sondages étaient dans cette fameuse marge d'erreur, en réalité, ce n'est pas cette marge d'erreur qui fausse le résultat.
La marge d'erreur a à voir avec la variance du pourcentage estimé et peut être diminuée avec un plus gros échantillon, mais la valeur moyenne, elle, ne changera jamais, pas plus que la nature de la loi, qui est effectivement très bien approximée par une loi normale. En gros, un sondage doit pouvoir en théorie avoir autant de chances de surestimer un candidat que de le sous-estimer. Il suffit de faire la calcul, si 10 sondages sont faits (et qu'importe la taille des échantillons), il n'y a qu'une chance sur 1024 pour que ce soit le même candidat qui soit toujours sous-estimé/surestimé. Autant dire que c'est vraiment ballot de tomber dans cette situation.
Mais ça, c'est la théorie.
Dans la pratique, tous les plans de sondages ne sont pas égaux. Certaines personnes peuvent être tirées avec une plus grande probabilité que d'autres. Certains sont difficilement joignables, les plus pauvres en général, et quand les sondés sont choisis, ce n'est pas de l'aléatoire pur. D'où les méthodes d'échantillonnage et de redressement afin de caler l'estimateur.
Dans quelques Etats (autour des Grands Lacs), on est très proche de cette situation (surestimation quasi systématique d'un candidat). Trois possibilités :
1) Vraiment pas de chance ! Moins d'une chance sur 1000 et on tombe dessus. J'y crois assez peu. On est en tout cas totalement en dehors du seuil traditionnel des 5%.
2) Evolution de l'opinion, vote utile des électeurs des petits candidats, sursaut tardif de la participation, etc... Bref, tant de paramètres difficiles à évaluer pour les sondeurs, car en réalité impossibles à prévoir. Mais cela n'a strictement rien à voir avec la fameuse marge d'erreur.
3) Plantage des sondages dans le redressement de l'estimateur. Là , la faute incombe aux sondeurs qui n'ont pas su traité les non-réponses, etc... Ce n'est pas toujours facile, surtout dans une élection aussi atypique, mais ça peut se corriger.
Pop03 n'a pas tort de proposer une moyenne des sondages. L'uniformisation sur une moyenne, c'est la loi des grands nombres et elle a bien tendance à faire diminuer la variance, et donc la marge d'erreur. Mais on peut aussi proposer une médiane des sondages. Cette médiane ne permet pas d'estimer un pourcentage avant l'élection, mais de pouvoir juger si la faute du plantage incombe aux sondeurs ou non (c'est un peu ce que tout le monde fait ici, j'ai l'impression). S'il y a eu beaucoup plus de sondages qui ont sous-estimé un candidat par rapport à ceux qui l'ont surestimé, les sondeurs peuvent difficilement se dédouaner. Avec toutes les limites de cette méthode évidemment : un nombre parfois très faible de sondages dans la dernière ligne droite, plusieurs instituts et presque autant de méthodes de travail différentes...
Facebook
Twitter
Voir toutes les vidéos




