Pareto a-t-il raison ?

Application sur mes contenus sur ZdS

Avec l’arrivée imminente de la fonctionnalité des statistiques pour les auteurs sur Zeste de Savoir, j’ai eu envie de jouer un peu avec les nombres. J’ai aussi récemment vu une vidéo qui parlait du principe de Pareto. J’ai donc eu envie d’appliquer ce dernier sur mes contenus publiés sur ZdS.

Le principe de Pareto nous dit que 80% des effets sont générés par seulement 20% des causes.

Pour l’analyse sur mes contenus publiés, je vais considérer deux effets en parallèle, le nombre de pages vues ou le nombre de visiteurs uniques. Quant aux causes, je ferais deux analyses. La mise en compétition de mes contenus dans leurs globalités, puis l’étude uniquement sur les pages du tuto Arduino.

Pour obtenir les chiffres de l’analyse, j’ai utilisé directement un export de l’interface Google Analytics1. Cependant, la nouvelle fonctionnalité de statistiques qui devrait arriver d’ici la fin de l’année pour tout le monde devrait permettre de faire exactement la même chose pour tous !

Enfin, l’analyse porte sur la période 01 novembre 2017 au 29 octobre 2018, soit un an de statistiques.


  1. Pas la peine de demander si vous pouvez y accéder, j’ai pu le faire car je travaille sur l’interface des statistiques pour ZdS.

Application macro

Avec tout les contenus

Commençons par faire une analyse globale. Après rapide listing, on constate que j’ai publié 32 tutoriels et articles depuis la naissance du site1. Pour appliquer le 20/80, on va donc considérer que en théorie, 6.5 (arrondi à 6) contenus sont censé apporter 80% des pages vues ou des visiteurs. Sans plus attendre voici les données.

Titre Pages vues % du total Vues uniques % du total
Arduino : premiers pas en informatique embarquée 168127 91.748 140845 91.240
Alimenter une Arduino sans USB 4701 2.565 4383 2.839
Gestion de la mémoire sur Arduino 3184 1.738 2869 1.859
Réaliser un télémètre à ultrasons 2025 1.105 1766 1.144
Des cartes sur votre site 1308 0.714 1093 0.708
Les balises audio et vidéo en HTML5 1290 0.704 1153 0.747
Ajouter des sorties numériques à l’Arduino, le 74HC595 652 0.356 542 0.351
C’est toute une histoire : le stockage 513 0.280 455 0.295
La recherche d’informations sur internet 427 0.233 329 0.213
TP Arduino : Faire une animation Space Invaders sur LCD 421 0.230 378 0.245
Google Maps JavaScript API V3 140 0.076 122 0.079
Refaire l’histoire avec git 94 0.051 89 0.058
Interview : Rencontre avec Eskimon 84 0.046 76 0.049
Interview : Rencontre avec Natalya 42 0.023 39 0.025
Interview : Rencontre avec Holosmos 34 0.019 30 0.019
Interview : Rencontre avec nohar 31 0.017 30 0.019
Interview : Rencontre avec SpaceFox 29 0.016 28 0.018
Interview : Rencontre avec Dominus Carnufex 18 0.010 18 0.012
Interview : Rencontre avec Piwit 17 0.009 13 0.008
Interview : Rencontre avec Taguan 16 0.009 16 0.010
On vous tient au jus ! 16 0.009 15 0.010
Interview : Rencontre avec zeqL 15 0.008 15 0.010
Bilan de la première semaine 11 0.006 11 0.007
Nouveautés de la version 15.6 Cédrat 10 0.005 9 0.006
Interview : Rencontre avec Solid 9 0.005 9 0.006
Interview : Rencontre avec Jereak 8 0.004 8 0.005
Interview : Rencontre avec viki53 8 0.004 8 0.005
ZdS passe bientôt en version 1.3 6 0.003 6 0.004
Zeste de Savoir passe en version 14 et complète l’API avec les MP 6 0.003 6 0.004
La Fabrication numérique 3 0.002 3 0.002
Zeste de Savoir passe en version 1.7 3 0.002 3 0.002
Total 183248 154367

Le constat est assez frappant. Rien que le tuto le plus "vendeur" amène à lui seul presque 92% de mon audience. Si l’on s’amuse à additionner les 6 premiers contenus, on découvre que ces derniers attire 98.5% de mon public ! Bref, Pareto ne se retrouve pas très bien ici (coucou @A-312, voici une exception !).

Cela dit, cela peut s’expliquer. En effet, le tuto Arduino comporte à lui seul une centaine de pages, ce qui est bien plus que tout les autres contenus réunis (qui sont tous mono-pages). Il a donc un poids bien plus important en terme de "surface" que les autres, ce qui doit sans aucun doute influencé le résultat.

En excluant le big-tuto Arduino

Je ne suis pas sur que cela ai du sens, mais je me suis amusé à supprimer de la liste le tuto Arduino et refaire les calculs. Pour le coup, la somme des 6 premiers contenus nous donne un joli pourcentage de 87% pour chacune des métriques observés, ce qui est déjà plus proches du résultat attendus (mais encore une fois, je pense que cette analyse n’a pas beaucoup de sens).

Titre Pages vues % du total Vues uniques % du total
Alimenter une Arduino sans USB 4701 31.089 4383 32.414
Gestion de la mémoire sur Arduino 3184 21.057 2869 21.217
Réaliser un télémètre à ultrasons 2025 13.392 1766 13.060
Des cartes sur votre site 1308 8.650 1093 8.083
Les balises audio et vidéo en HTML5 1290 8.531 1153 8.527
Ajouter des sorties numériques à l’Arduino, le 74HC595 652 4.312 542 4.008
C’est toute une histoire : le stockage 513 3.393 455 3.365
La recherche d’informations sur internet 427 2.824 329 2.433
TP Arduino : Faire une animation Space Invaders sur LCD 421 2.784 378 2.795
Google Maps JavaScript API V3 140 0.926 122 0.902
Refaire l’histoire avec git 94 0.622 89 0.658
Interview : Rencontre avec Eskimon 84 0.556 76 0.562
Interview : Rencontre avec Natalya 42 0.278 39 0.288
Interview : Rencontre avec Holosmos 34 0.225 30 0.222
Interview : Rencontre avec nohar 31 0.205 30 0.222
Interview : Rencontre avec SpaceFox 29 0.192 28 0.207
Interview : Rencontre avec Dominus Carnufex 18 0.119 18 0.133
Interview : Rencontre avec Piwit 17 0.112 13 0.096
Interview : Rencontre avec Taguan 16 0.106 16 0.118
On vous tient au jus ! 16 0.106 15 0.111
Interview : Rencontre avec zeqL 15 0.099 15 0.111
Bilan de la première semaine 11 0.073 11 0.081
Nouveautés de la version 15.6 Cédrat 10 0.066 9 0.067
Interview : Rencontre avec Solid 9 0.060 9 0.067
Interview : Rencontre avec Jereak 8 0.053 8 0.059
Interview : Rencontre avec viki53 8 0.053 8 0.059
ZdS passe bientôt en version 1.3 6 0.040 6 0.044
Zeste de Savoir passe en version 14 et complète l’API avec les MP 6 0.040 6 0.044
La Fabrication numérique 3 0.020 3 0.022
Zeste de Savoir passe en version 1.7 3 0.020 3 0.022
Total 15121 13522

  1. Je laisse volontairement de côté les billets, ces derniers n’ont pas été publié assez longtemps pour rentrer dans le créneau de l’analyse.

Application micro

Appliquons le même raisonnement sur un seul tuto, mon best-seller perso, je parle bien sûr du tuto Arduino. Sans plus attendre, voici les données sur l’année qui vient de s’écouler.

URL Pages vues en % Vues uniques en %
/742_decouverte-de-larduino/3418_le-langage-arduino-12/ 18072 10.756 15429 10.961
/742_decouverte-de-larduino/3414_presentation-darduino/ 16612 9.887 13871 9.854
/ 16385 9.752 11654 8.279
/742_decouverte-de-larduino/3416_le-logiciel/ 9641 5.738 7825 5.559
/743_gestion-des-entrees-sorties/3420_notre-premier-programme/ 9389 5.588 7861 5.585
/742_decouverte-de-larduino/3419_le-langage-arduino-22/ 8814 5.246 7624 5.416
/742_decouverte-de-larduino/3417_le-materiel/ 7649 4.553 6563 4.663
/743_gestion-des-entrees-sorties/3424_afficheurs-7-segments/ 7360 4.381 6169 4.383
/742_decouverte-de-larduino/3415_quelques-bases-elementaires/ 6907 4.111 5961 4.235
/743_gestion-des-entrees-sorties/3421_introduire-le-temps/ 5027 2.992 4304 3.058
/743_gestion-des-entrees-sorties/3423_un-simple-bouton/ 4380 2.607 3852 2.737
/743_gestion-des-entrees-sorties/ 4332 2.578 3522 2.502
/743_gestion-des-entrees-sorties/3422_tp-feux-de-signalisation-routiere/ 4100 2.440 3491 2.480
/1213_internet-of-things-arduino-sur-internet/4848_arduino-et-ethernet-serveur/ 3597 2.141 3111 2.210
/747_le-mouvement-grace-aux-moteurs/3437_le-moteur-a-courant-continu/ 3515 2.092 3045 2.163
/1213_internet-of-things-arduino-sur-internet/4847_arduino-et-ethernet-client/ 3475 2.068 2957 2.101
/744_la-communication-avec-arduino/3427_envoyer-et-recevoir-des-donnees-sur-la-voie-serie/ 3239 1.928 2815 2.000
/748_laffichage-une-autre-maniere-dinteragir/3444_votre-premier-texte-sur-le-lcd/ 3017 1.796 2638 1.874
/747_le-mouvement-grace-aux-moteurs/3439_a-petits-pas-le-moteur-pas-a-pas/ 2916 1.736 2641 1.876
/743_gestion-des-entrees-sorties/3425_tp-parking/ 2538 1.511 2209 1.569
/744_la-communication-avec-arduino/3426_generalites-sur-la-voie-serie/ 2403 1.430 2107 1.497
/745_les-grandeurs-analogiques/3430_les-entrees-analogiques-de-larduino/ 2248 1.338 1995 1.417
/1213_internet-of-things-arduino-sur-internet/4846_decouverte-de-lethernet-sur-arduino/ 2179 1.297 1770 1.257
/748_laffichage-une-autre-maniere-dinteragir/3443_les-ecrans-lcd/ 2093 1.246 1833 1.302
/747_le-mouvement-grace-aux-moteurs/3438_un-moteur-qui-a-de-la-tete-le-servomoteur/ 1991 1.185 1766 1.255
/746_les-capteurs-et-lenvironnement-autour-darduino/3435_differents-types-de-mesures/ 1752 1.043 1525 1.083
/742_decouverte-de-larduino/ 1611 0.959 1254 0.891
/746_les-capteurs-et-lenvironnement-autour-darduino/3434_generalites-sur-les-capteurs/ 1500 0.893 1317 0.936
/744_la-communication-avec-arduino/ 1239 0.737 1021 0.725
/744_la-communication-avec-arduino/3428_tp-baignade-interdite/ 1170 0.696 1040 0.739
/744_la-communication-avec-arduino/3429_annexe-ordinateur-et-voie-serie-dans-un-autre-langage-de-programmation/ 1139 0.678 982 0.698
/746_les-capteurs-et-lenvironnement-autour-darduino/3436_des-capteurs-plus-evolues/ 1063 0.633 933 0.663
/748_laffichage-une-autre-maniere-dinteragir/3445_tp-supervision-avec-un-lcd/ 991 0.590 876 0.622
/745_les-grandeurs-analogiques/3431_tp-vu-metre-a-led/ 850 0.506 758 0.539
/745_les-grandeurs-analogiques/3432_et-les-sorties-analogiques-enfin-presque/ 828 0.493 722 0.513
/745_les-grandeurs-analogiques/3433_exercice-une-animation-youtube/ 606 0.361 538 0.382
/1213_internet-of-things-arduino-sur-internet/ 551 0.328 446 0.317
/748_laffichage-une-autre-maniere-dinteragir/ 494 0.294 422 0.300
/745_les-grandeurs-analogiques/ 489 0.291 415 0.295
/747_le-mouvement-grace-aux-moteurs/ 489 0.291 414 0.294
/746_les-capteurs-et-lenvironnement-autour-darduino/ 447 0.266 379 0.269
/742_decouverte-de-larduino/3414_presentation-darduino/blog.ardublock.com/ 429 0.255 372 0.264
/?page=2 322 0.192 235 0.167
/742_decouverte-de-larduino/3447_le-materiel/ 23 0.014 2 0.001
/742_decouverte-de-larduino/3419_le-langage-arduino-22/#2–10792_les-fonctions/ 20 0.012 6 0.004
/?page=1 10 0.006 8 0.006
/742 decouverte-de-larduino/ 7 0.004 4 0.003
/743_gestion-des-entrees-sorties/3420_notre-premier-programme/ - 1–10752_la-diode-electroluminescente/ 6 0.004 5 0.004
/743_gestion-des-entrees-sorties /3425_tp-parking/ 5 0.003 2 0.001
/742_decouverte-de-larduino/3418_le-langage-/ 4 0.002 2 0.001
/743_gestion-des-entrees-sorties /3425_tp-parking/ noooon/ 4 0.002 1 0.001
/744_la-communication-avec-arduino/3429_annexe-ordi/ 4 0.002 1 0.001
/744_lacommunication-avec-arduino/ 4 0.002 2 0.001
/742_decouverte-de-larduino/3417_le-materiel/#1–10785_presentation-de-la-carte/ 3 0.002 2 0.001
/748_laffichage-une-autre-maniere-dinteragir/3444_votre-premier-texte-sur-le-lcd/ - 3–10698_creer-un-caractere/ 3 0.002 1 0.001
/74/ 2 0.001 2 0.001
/742_decouverte-de-arduino/3415_quelques-base-elementaire/ 2 0.001 1 0.001
/742_decouverte-de-larduino/3414_presentation-dardu/ 2 0.001 1 0.001
/742_decouverte-de-larduino/3414_presentation-darduino/3417_le-materiel/ 2 0.001 1 0.001
/742_decouverte-de-larduino/3414_presentation-darduprimittino/ 2 0.001 1 0.001
/742_decouverte-de-larduino/3414_presentation/ 2 0.001 2 0.001
/742_decouverte-de-larduino/3416_le-logiciel/wikipedia/ 2 0.001 1 0.001
/742_decouverte-de-larduino/3417 lemateriel/ 2 0.001 1 0.001
/743_gestion-des-entrees-sorties/3420_notre-/ 2 0.001 1 0.001
/743_gestion-des-entrees-sorties/3423_un-simple-bouton/7/ 2 0.001 1 0.001
/745_les grandeurs-analogiques/3430 les-entrees-analogiques-de-larduino/ 2 0.001 1 0.001
/745_les grandeurs-analogiques/3430les-entrees-analogiques-de-larduino/ 2 0.001 1 0.001
/748_laffichage-une-autre-maniere-dinteragir/3443_les-ecrans-lcd/ - 3–10695_comment-on-sen-sert/ 2 0.001 2 0.001
/748_laffichage-une-autre-maniere-dinteragir/3444_v/ 2 0.001 1 0.001
/?epik=0sG73E_IWX6l8 1 0.001 1 0.001
/?fbclid=IwAR0zB3w1AWgxXrdHpW99ed6EFfk_QB7MPxAhmqjvKmzTmdoGWlt-INssRyk 1 0.001 1 0.001
/1213_internet-of-things-arduino-sur internet/4847_arduino-et-ethernet-client/ 1 0.001 1 0.001
/1213_internet-of-things-arduino-sur-internet/4847_arduino-et-ethernet-client/)/ 1 0.001 1 0.001
/1213_internet-of-things-arduino-sur-internet/4847_arduino-et-ethernet-client/null/ 1 0.001 1 0.001
/1213_internet-of-things-arduino-sur-internet/4848_arduino-et-ethernet-/ 1 0.001 1 0.001
/1213_internet-of-things-arduino-sur-internet/4848_arduino-et-ethernet-serveur/?fbclid=IwAR0u3IXEr3cveLoi6qdxcFcx9hgR-B33GklmAn42eMVIfd3h9Dd6rpNkPfM 1 0.001 1 0.001
/1213/ 1 0.001 1 0.001
/742 _decouverte-de-larduino/ 1 0.001 1 0.001
/742 20decouverte-de-larduino/ 1 0.001 1 0.001
/742 decouverte-de-larduino/3417 le-materiel/ 1 0.001 1 0.001
/742_dec bvouverte-de-larduino/3418_le-langage-arduino-12/ 1 0.001 1 0.001
/742_decouverte-de-larduino:3417_le-materiel/ 1 0.001 1 0.001
/742_decouverte-de-larduino/3411_le-materiel/ 1 0.001 1 0.001
/742decouverte-de-larduino/3414_presentation-darduino/?_e_pi=7,PAGE_ID10,5069166513 1 0.001 1 0.001
/742_decouverte-de-larduino/3414_presentation-darduino/Auteur : aucun auteur est stipuléDate de mise à jour : aucune date stipulée/ 1 0.001 1 0.001
/742_decouverte-de-larduino/3414_presentation-darduino/null/ 1 0.001 1 0.001
/742_decouverte-de-larduino/3415_quelques-bases-elementaires/null/ 1 0.001 1 0.001
/742_decouverte-de-larduino/3416_le-logiciel/ pdf/ 1 0.001 1 0.001
/742_decouverte-de-larduino/3417 lemateriel-110785-presentation-de-la-carte/ 1 0.001 1 0.001
/742_decouverte-de-larduino/3417_lemateriel/ 1 0.001 1 0.001
/742decouverte-de-larduino/3418_le-langage-arduino-12/?_e_pi=7,PAGE_ID10,9285555795 1 0.001 1 0.001
/742_decouverte-de-larduino/3418_le-langage-arduino-12/int martin DIS/ 1 0.001 1 0.001
/742_decouverte-de-larduino/3418_le-langage-arduino-22/ 1 0.001 1 0.001
/742_decouverte-de-larduino/3418_le-language-arduino-12/ 1 0.001 1 0.001
/742_decouverte-fr-larduino/3418_le-language-arduino-12/ 1 0.001 1 0.001
/742_decouverte

<br>

-de-larduino/3415_quelques-bases-elementaires/
1 0.001 1 0.001
/742/decouverte-de-larduino/ 1 0.001 1 0.001
/742/decouverte-de-larduino/3417_le-materiel/ 1 0.001 1 0.001
/74220decouverte-de-larduino/ 1 0.001 1 0.001
/743_gestion-des-entrees-sorties/3422_tp-feux-de-signalisation-routiere/?sa=X&ved=2ahUKEwiN_rj9z-zdAhVFBywKHUy7D3MQ9QEwAXoECAYQCA 1 0.001 1 0.001
/743_gestion-des-entrees-sorties/3423_un-simple-bouton/ - 3–10764_interagir-avec-les-led/ 1 0.001 1 0.001
/743_gestion-des-entrees-sorties/3423_un-simple-bouton/null/ 1 0.001 1 0.001
/743_gestion-des-entrees-sorties/3424_afficheurs-7-segments/?fbclid=IwAR0JMHH1P-6LbHMBOrVjwXs4KH8BtzNSiTxCAhbvPJiRXN-mhE5mw5fgxYA 1 0.001 1 0.001
/743_gestion-des-entrees-sorties/3424_afficheurs-7-segments/?sa=X&ved=2ahUKEwiSn52ig6LeAhUwyoUKHfFtDBIQ9QEwAnoECAEQBQ 1 0.001 1 0.001
/743_gestion-des-entrees-sorties/3425_tp-parking/https://www.youtube.com/?hl=fr&gl=FR 1 0.001 1 0.001
/743_gestion-des-sortie/3421_introduire-le-temps/ 1 0.001 1 0.001
/743/ 1 0.001 1 0.001
/744_la-communication-avec-arduino// 1 0.001 1 0.001
/744_la-communication-avec-arduino/3426_generalites/ 1 0.001 1 0.001
/744_la-communication-avec-arduino/3429_annexe-ordinateur-et-voie-serie-dans-un-autre-langage-de-programmation/?_sm_byp=iVVNWn3B7SVQWTWN 1 0.001 1 0.001
/747_le-mouvement-grace-aux-moteurs/3437_le-moteur-a-courant-continu/?fbclid=IwAR0F5F5z0h7rAJquWGqjHw_GknWSHMrtl6HaP7u6iqzlG5I1WdyRMjjL-7U 1 0.001 1 0.001
/747_le-mouvement-grace-aux-moteurs/3437_le-moteur-a-courant-continu/?fbclid=IwAR0hUF_6zD4sXOTM52wDRPDG2bMeHF29G1CatkGpAcqgcCiSLRmK56Ttyq0 1 0.001 1 0.001
/749_en-c-avec-qt/ 1 0.001 1 0.001
Total 168015 100.000 140760 100.000

Lors de l’exportation des statistiques, on trouve 113 pages recensés par analytics. 20% de ces 113 pages cela nous donne 22.6, donc on va là encore arrondir par le bas et considérer que en théorie, selon le principe de Pareto, les 22 meilleures pages du tuto font 80% des vues.

Dans les faits… il a raison !! Si on s’autorise un peu de flexibilité sur les nombres, on trouve que les 22 premières pages font 86% des pages vues ou des visiteurs uniques. Pas mal !

Mix'n match

Afin de pousser l’analyse jusqu’au bout, on va mélanger les deux sources d’informations. Dans la première partie, nous avions un gros tuto multi-pages contre des contenus mono-pages. Dans la seconde, on a "éclaté" le gros tuto pour analyser toutes ses pages individuellement. Dans cette dernière partie, voyons voir ce qui se passe en mélangeant des causes de même niveau, c’est à dire en inspectant les pages individuels les unes aux autres.

Titre/URL Pages vues % du total Vues uniques % du total
/742_decouverte-de-larduino/3418_le-langage-arduino-12/ 18072 9.87 15429 10.00
/742_decouverte-de-larduino/3414_presentation-darduino/ 16612 9.07 13871 8.99
/ 16385 8.95 11654 7.55
/742_decouverte-de-larduino/3416_le-logiciel/ 9641 5.26 7825 5.07
/743_gestion-des-entrees-sorties/3420_notre-premier-programme/ 9389 5.13 7861 5.10
/742_decouverte-de-larduino/3419_le-langage-arduino-22/ 8814 4.81 7624 4.94
/742_decouverte-de-larduino/3417_le-materiel/ 7649 4.18 6563 4.25
/743_gestion-des-entrees-sorties/3424_afficheurs-7-segments/ 7360 4.02 6169 4.00
/742_decouverte-de-larduino/3415_quelques-bases-elementaires/ 6907 3.77 5961 3.86
/743_gestion-des-entrees-sorties/3421_introduire-le-temps/ 5027 2.74 4304 2.79
Alimenter une Arduino sans USB 4701 2.57 4383 2.84
/743_gestion-des-entrees-sorties/3423_un-simple-bouton/ 4380 2.39 3852 2.50
/743_gestion-des-entrees-sorties/ 4332 2.37 3522 2.28
/743_gestion-des-entrees-sorties/3422_tp-feux-de-signalisation-routiere/ 4100 2.24 3491 2.26
/1213_internet-of-things-arduino-sur-internet/4848_arduino-et-ethernet-serveur/ 3597 1.96 3111 2.02
/747_le-mouvement-grace-aux-moteurs/3437_le-moteur-a-courant-continu/ 3515 1.92 3045 1.97
/1213_internet-of-things-arduino-sur-internet/4847_arduino-et-ethernet-client/ 3475 1.90 2957 1.92
/744_la-communication-avec-arduino/3427_envoyer-et-recevoir-des-donnees-sur-la-voie-serie/ 3239 1.77 2815 1.82
Gestion de la mémoire sur Arduino 3184 1.74 2869 1.86
/748_laffichage-une-autre-maniere-dinteragir/3444_votre-premier-texte-sur-le-lcd/ 3017 1.65 2638 1.71
/747_le-mouvement-grace-aux-moteurs/3439_a-petits-pas-le-moteur-pas-a-pas/ 2916 1.59 2641 1.71
/743_gestion-des-entrees-sorties/3425_tp-parking/ 2538 1.39 2209 1.43
/744_la-communication-avec-arduino/3426_generalites-sur-la-voie-serie/ 2403 1.31 2107 1.37
/745_les-grandeurs-analogiques/3430_les-entrees-analogiques-de-larduino/ 2248 1.23 1995 1.29
/1213_internet-of-things-arduino-sur-internet/4846_decouverte-de-lethernet-sur-arduino/ 2179 1.19 1770 1.15
/748_laffichage-une-autre-maniere-dinteragir/3443_les-ecrans-lcd/ 2093 1.14 1833 1.19
Réaliser un télémètre à ultrasons 2025 1.11 1766 1.14
/747_le-mouvement-grace-aux-moteurs/3438_un-moteur-qui-a-de-la-tete-le-servomoteur/ 1991 1.09 1766 1.14
/746_les-capteurs-et-lenvironnement-autour-darduino/3435_differents-types-de-mesures/ 1752 0.96 1525 0.99
/742_decouverte-de-larduino/ 1611 0.88 1254 0.81
/746_les-capteurs-et-lenvironnement-autour-darduino/3434_generalites-sur-les-capteurs/ 1500 0.82 1317 0.85
Des cartes sur votre site 1308 0.71 1093 0.71
Les balises audio et vidéo en HTML5 1290 0.70 1153 0.75
/744_la-communication-avec-arduino/ 1239 0.68 1021 0.66
/744_la-communication-avec-arduino/3428_tp-baignade-interdite/ 1170 0.64 1040 0.67
/744_la-communication-avec-arduino/3429_annexe-ordinateur-et-voie-serie-dans-un-autre-langage-de-programmation/ 1139 0.62 982 0.64
/746_les-capteurs-et-lenvironnement-autour-darduino/3436_des-capteurs-plus-evolues/ 1063 0.58 933 0.60
/748_laffichage-une-autre-maniere-dinteragir/3445_tp-supervision-avec-un-lcd/ 991 0.54 876 0.57
/745_les-grandeurs-analogiques/3431_tp-vu-metre-a-led/ 850 0.46 758 0.49
/745_les-grandeurs-analogiques/3432_et-les-sorties-analogiques-enfin-presque/ 828 0.45 722 0.47
Ajouter des sorties numériques à l’Arduino, le 74HC595 652 0.36 542 0.35
/745_les-grandeurs-analogiques/3433_exercice-une-animation-youtube/ 606 0.33 538 0.35
/1213_internet-of-things-arduino-sur-internet/ 551 0.30 446 0.29
C’est toute une histoire : le stockage 513 0.28 455 0.29
/748_laffichage-une-autre-maniere-dinteragir/ 494 0.27 422 0.27
/745_les-grandeurs-analogiques/ 489 0.27 415 0.27
/747_le-mouvement-grace-aux-moteurs/ 489 0.27 414 0.27
/746_les-capteurs-et-lenvironnement-autour-darduino/ 447 0.24 379 0.25
/742_decouverte-de-larduino/3414_presentation-darduino/blog.ardublock.com/ 429 0.23 372 0.24
La recherche d’informations sur internet 427 0.23 329 0.21
TP Arduino : Faire une animation Space Invaders sur LCD 421 0.23 378 0.25
/?page=2 322 0.18 235 0.15
Google Maps JavaScript API V3 140 0.08 122 0.08
Refaire l’histoire avec git 94 0.05 89 0.06
Interview : Rencontre avec Eskimon 84 0.05 76 0.05
Interview : Rencontre avec Natalya 42 0.02 39 0.03
Interview : Rencontre avec Holosmos 34 0.02 30 0.02
Interview : Rencontre avec nohar 31 0.02 30 0.02
Interview : Rencontre avec SpaceFox 29 0.02 28 0.02
/742_decouverte-de-larduino/3447_le-materiel/ 23 0.01 2 0.00
/742_decouverte-de-larduino/3419_le-langage-arduino-22/#2–10792_les-fonctions/ 20 0.01 6 0.00
Interview : Rencontre avec Dominus Carnufex 18 0.01 18 0.01
Interview : Rencontre avec Piwit 17 0.01 13 0.01
Interview : Rencontre avec Taguan 16 0.01 16 0.01
On vous tient au jus ! 16 0.01 15 0.01
Interview : Rencontre avec zeqL 15 0.01 15 0.01
Bilan de la première semaine 11 0.01 11 0.01
Nouveautés de la version 15.6 Cédrat 10 0.01 9 0.01
/?page=1 10 0.01 8 0.01
Interview : Rencontre avec Solid 9 0.00 9 0.01
Interview : Rencontre avec Jereak 8 0.00 8 0.01
Interview : Rencontre avec viki53 8 0.00 8 0.01
/742 decouverte-de-larduino/ 7 0.00 4 0.00
ZdS passe bientôt en version 1.3 6 0.00 6 0.00
Zeste de Savoir passe en version 14 et complète l’API avec les MP 6 0.00 6 0.00
/743_gestion-des-entrees-sorties/3420_notre-premier-programme/ - 1–10752_la-diode-electroluminescente/ 6 0.00 5 0.00
/743_gestion-des-entrees-sorties /3425_tp-parking/ 5 0.00 2 0.00
/742_decouverte-de-larduino/3418_le-langage-/ 4 0.00 2 0.00
/743_gestion-des-entrees-sorties /3425_tp-parking/ noooon/ 4 0.00 1 0.00
/744_la-communication-avec-arduino/3429_annexe-ordi/ 4 0.00 1 0.00
/744_lacommunication-avec-arduino/ 4 0.00 2 0.00
La Fabrication numérique 3 0.00 3 0.00
Zeste de Savoir passe en version 1.7 3 0.00 3 0.00
/742_decouverte-de-larduino/3417_le-materiel/#1–10785_presentation-de-la-carte/ 3 0.00 2 0.00
/748_laffichage-une-autre-maniere-dinteragir/3444_votre-premier-texte-sur-le-lcd/ - 3–10698_creer-un-caractere/ 3 0.00 1 0.00
/74/ 2 0.00 2 0.00
/742_decouverte-de-arduino/3415_quelques-base-elementaire/ 2 0.00 1 0.00
/742_decouverte-de-larduino/3414_presentation-dardu/ 2 0.00 1 0.00
/742_decouverte-de-larduino/3414_presentation-darduino/3417_le-materiel/ 2 0.00 1 0.00
/742_decouverte-de-larduino/3414_presentation-darduprimittino/ 2 0.00 1 0.00
/742_decouverte-de-larduino/3414_presentation/ 2 0.00 2 0.00
/742_decouverte-de-larduino/3416_le-logiciel/wikipedia/ 2 0.00 1 0.00
/742_decouverte-de-larduino/3417 lemateriel/ 2 0.00 1 0.00
/743_gestion-des-entrees-sorties/3420_notre-/ 2 0.00 1 0.00
/743_gestion-des-entrees-sorties/3423_un-simple-bouton/7/ 2 0.00 1 0.00
/745_les grandeurs-analogiques/3430 les-entrees-analogiques-de-larduino/ 2 0.00 1 0.00
/745_les grandeurs-analogiques/3430les-entrees-analogiques-de-larduino/ 2 0.00 1 0.00
/748_laffichage-une-autre-maniere-dinteragir/3443_les-ecrans-lcd/ - 3–10695_comment-on-sen-sert/ 2 0.00 2 0.00
/748_laffichage-une-autre-maniere-dinteragir/3444_v/ 2 0.00 1 0.00
/?epik=0sG73E_IWX6l8 1 0.00 1 0.00
/?fbclid=IwAR0zB3w1AWgxXrdHpW99ed6EFfk_QB7MPxAhmqjvKmzTmdoGWlt-INssRyk 1 0.00 1 0.00
/1213_internet-of-things-arduino-sur internet/4847_arduino-et-ethernet-client/ 1 0.00 1 0.00
/1213_internet-of-things-arduino-sur-internet/4847_arduino-et-ethernet-client/)/ 1 0.00 1 0.00
/1213_internet-of-things-arduino-sur-internet/4847_arduino-et-ethernet-client/null/ 1 0.00 1 0.00
/1213_internet-of-things-arduino-sur-internet/4848_arduino-et-ethernet-/ 1 0.00 1 0.00
/1213_internet-of-things-arduino-sur-internet/4848_arduino-et-ethernet-serveur/?fbclid=IwAR0u3IXEr3cveLoi6qdxcFcx9hgR-B33GklmAn42eMVIfd3h9Dd6rpNkPfM 1 0.00 1 0.00
/1213/ 1 0.00 1 0.00
/742 _decouverte-de-larduino/ 1 0.00 1 0.00
/742 20decouverte-de-larduino/ 1 0.00 1 0.00
/742 decouverte-de-larduino/3417 le-materiel/ 1 0.00 1 0.00
/742_dec bvouverte-de-larduino/3418_le-langage-arduino-12/ 1 0.00 1 0.00
/742_decouverte-de-larduino:3417_le-materiel/ 1 0.00 1 0.00
/742_decouverte-de-larduino/3411_le-materiel/ 1 0.00 1 0.00
/742decouverte-de-larduino/3414_presentation-darduino/?_e_pi=7,PAGE_ID10,5069166513 1 0.00 1 0.00
/742_decouverte-de-larduino/3414_presentation-darduino/Auteur : aucun auteur est stipuléDate de mise à jour : aucune date stipulée/ 1 0.00 1 0.00
/742_decouverte-de-larduino/3414_presentation-darduino/null/ 1 0.00 1 0.00
/742_decouverte-de-larduino/3415_quelques-bases-elementaires/null/ 1 0.00 1 0.00
/742_decouverte-de-larduino/3416_le-logiciel/ pdf/ 1 0.00 1 0.00
/742_decouverte-de-larduino/3417 lemateriel-110785-presentation-de-la-carte/ 1 0.00 1 0.00
/742_decouverte-de-larduino/3417_lemateriel/ 1 0.00 1 0.00
/742decouverte-de-larduino/3418_le-langage-arduino-12/?_e_pi=7,PAGE_ID10,9285555795 1 0.00 1 0.00
/742_decouverte-de-larduino/3418_le-langage-arduino-12/int martin DIS/ 1 0.00 1 0.00
/742_decouverte-de-larduino/3418_le-langage-arduino-22/ 1 0.00 1 0.00
/742_decouverte-de-larduino/3418_le-language-arduino-12/ 1 0.00 1 0.00
/742_decouverte-fr-larduino/3418_le-language-arduino-12/ 1 0.00 1 0.00
/742_decouverte

<br>

-de-larduino/3415_quelques-bases-elementaires/
1 0.00 1 0.00
/742/decouverte-de-larduino/ 1 0.00 1 0.00
/742/decouverte-de-larduino/3417_le-materiel/ 1 0.00 1 0.00
/74220decouverte-de-larduino/ 1 0.00 1 0.00
/743_gestion-des-entrees-sorties/3422_tp-feux-de-signalisation-routiere/?sa=X&ved=2ahUKEwiN_rj9z-zdAhVFBywKHUy7D3MQ9QEwAXoECAYQCA 1 0.00 1 0.00
/743_gestion-des-entrees-sorties/3423_un-simple-bouton/ - 3–10764_interagir-avec-les-led/ 1 0.00 1 0.00
/743_gestion-des-entrees-sorties/3423_un-simple-bouton/null/ 1 0.00 1 0.00
/743_gestion-des-entrees-sorties/3424_afficheurs-7-segments/?fbclid=IwAR0JMHH1P-6LbHMBOrVjwXs4KH8BtzNSiTxCAhbvPJiRXN-mhE5mw5fgxYA 1 0.00 1 0.00
/743_gestion-des-entrees-sorties/3424_afficheurs-7-segments/?sa=X&ved=2ahUKEwiSn52ig6LeAhUwyoUKHfFtDBIQ9QEwAnoECAEQBQ 1 0.00 1 0.00
/743_gestion-des-entrees-sorties/3425_tp-parking/https://www.youtube.com/?hl=fr&gl=FR 1 0.00 1 0.00
/743_gestion-des-sortie/3421_introduire-le-temps/ 1 0.00 1 0.00
/743/ 1 0.00 1 0.00
/744_la-communication-avec-arduino// 1 0.00 1 0.00
/744_la-communication-avec-arduino/3426_generalites/ 1 0.00 1 0.00
/744_la-communication-avec-arduino/3429_annexe-ordinateur-et-voie-serie-dans-un-autre-langage-de-programmation/?_sm_byp=iVVNWn3B7SVQWTWN 1 0.00 1 0.00
/747_le-mouvement-grace-aux-moteurs/3437_le-moteur-a-courant-continu/?fbclid=IwAR0F5F5z0h7rAJquWGqjHw_GknWSHMrtl6HaP7u6iqzlG5I1WdyRMjjL-7U 1 0.00 1 0.00
/747_le-mouvement-grace-aux-moteurs/3437_le-moteur-a-courant-continu/?fbclid=IwAR0hUF_6zD4sXOTM52wDRPDG2bMeHF29G1CatkGpAcqgcCiSLRmK56Ttyq0 1 0.00 1 0.00
/749_en-c-avec-qt/ 1 0.00 1 0.00
Total 183135 100.00 154281 100.00

Sans détour, faisons les calculs !

En mixant tout ensemble, on obtient 143 pages de contenu, et 20% de tout cela nous donne donc un groupe de 28 pages (28.6).

Si l’on fait la somme des pages vues ou des visiteurs uniques pour le top 28, on obtient alors un pourcentage de … 88% . C’est encore un peu élevé, mais mine de rien ca tend à se rapprocher du principe étudié !


Conclusion, comme l’avais prédit @pierre_24 ou encore @A-312 sur Twitter, Pareto se trompe rarement…si l’échantillon est assez grand. En effet, sur l’application macro contenant tout mes contenus, le tuto Arduino a un poids trop élevé, notamment dû à son format différent (beaucoup plus de pages, donc beaucoup plus de points d’entrées pour le visiter). Toutefois, une fois les contenus aplaties à leur plus simple niveau, la relation semble apparaître…

Les mathématiques et statistiques n’ont cependant jamais été ma passion. Si vous constatez des erreurs dans l’analyse, n’hésitez pas à m’en faire part !

26 commentaires

Ok, j’ai cherché partout sauf là. Eh bien je dois dire que je m’attendais un peu à ce genre de résultats (sachant la popularité du tuto Arduino) … Mais pas à ce point là, en fait. Au delà de ça, et tuto Arduino exclu, ma question sur l’échantillon me venait parce que je m’interroge sur l’effet, par exemple, de l’age, et d’éventuelles remises en avant ponctuelles :)

Je ne pense pas que la loi de Pareto ait vocation à être précise. Elle dit juste que généralement une minorité de causes causent la majorité des effets. Le 80–20 est là pour illustrer mais je ne pense pas que le propos de cette loi soit là, qu’elle dise que c’est 80–20 ou que c’est toujours 80–20. Mais je me trompe peut-être.

Si c’est ça, Pareto revient juste à dire que les effets ne sont pas équitablement répartis. Pas de quoi coller un nom à l’idée, c’est évidemment le cas pour n’importe quel processus invoquant des agents qui ne sont identiques (i.e. à peu près n’importe quel processus de la vie de tous les jours). Si on dit que c’est 80–20 à 30–30 près, ça rend la chose pas très intéressante puisque la seule chose qu’on peut prédire avec est que l’on n’est pas sur un phénomène impliquant des agents strictement identiques.

Bref, tout ça pour dire que dans un cas comme dans l’autre, cette loi ne me parait pas très intéressante. Elle est soit à côté de la plaque, soit complètement évidente.

+1 -1

Ca va plus vite à dire "loi de Pareto" que "loi par laquelle la majorité des effets sont produits par une minorité de causes". Et d’une ce n’est pas si évident que tu le dis, de deux ce qui se conçoit bien s’énonce clairement et vice-versa, énoncer cette loi même si elle est évidente permet de l’avoir à l’esprit.

Je pense qu’il serait intéressant de lire l’article Wikipedia consacré à la question avant de supposer des théories sur cette loi.

D’autre part, cette loi semble triviale une fois énoncée, n’a jamais eu vocation à donner des pourcentages précis et n’est d’ailleurs pas conçue pour ça. En fait elle était connue bien avant Pareto (cf l’article). Mais le fait qu’elle ait un nom est extrêmement pratique pour la rappeler à l’existence – de décideurs, typiquement.

Qu’on lui donne un nom, pourquoi pas, c’est pas ça qui me dérange, c’est plutôt qu’on s’excite autour de la notion alors qu’elle n’a rien de profond ni de puissant si on la prend pour ce qu’elle est (je ne vise pas l’article, c’est une tentative rigolote de voir si les 80–20 sont dans les choux ou pas). Ça me rappelle un peu la loi de Moore ou l’effet Mandala (ou encore des tas d’autres loi, on en trouve des affligeantes marrantes ici, sur lesquelles il serait surement avisé d’appliquer celle de Sturgeon) autour desquelles on construit une espèce de buzz sans réfléchir à la pertinence du truc ni à ses cadres d’application.

D’après wiki, il aurait mis en évidence ses travaux avec un exemple qui fait ressortir 20–80 et c’est resté. Je vois plus le 20–80 comme un moyen mémo-technique qu’une valeur à chercher sauf pour le côté fun.

Cette loi permet de garder en mémoire qu’on a plus de chance d’avoir des têtes de liste qu’une liste égalitaire. La présence de cet effet agit sur la façon de réaliser certains travaux. Par exemple en Audit, cet effet permet de diminuer le nombre de client à vérifier et de facture à circulariser. La présence client vache-à-lait permet d’atteindre le seuil de signification plus rapidement et donc de ne pas contrôler/vérifier toutes les factures.


Après comme tu le décris @adri1, on décrit quelque chose d’évident :

  • Soit c’est équilibré ;
  • Soit il y a un podium/haut de liste.

A vue de nez, on peut rarement se tromper. On sait quand on peut l’appliquer ou non.

Mais c’est tellement plus marrant de chercher à tomber sur 20–80 au détour d’une formule dans son tableur EXCEL sur un dossier (entreprise cliente).

+0 -0

Pas de quoi coller un nom à l’idée, c’est évidemment le cas pour n’importe quel processus invoquant des agents qui ne sont identiques

Je pense que tu critiques un peu facilement ce brave Vilfredo ! Le principe de Pareto est à ma connaissance associée aux distributions en loi de puissances, qui sont quelque chose d’un peu plus formel et utile que la version "grand public" du 80/20. Pereto est connu pour ses estimations de la distribution des revenus, et avoir montré la stabilité de la distribution dans le temps.

Enfin, il n’y a rien d’évident à avoir des lois de puissances "pour n’importe quel processus où les agents ne sont pas identiques". Regarde la distribution de la taille des gens ou de leur poids : on est sur des gaussiennes et non des lois de puissance. A mon avis, les lois de puissances se retrouvent surtout dans les cas où la variable n’est pas bornée à une extrémité : revenu, force des tremblement de terre, variations boursières, nombres d’abonnés à une chaine youTube, etc. Quand il existe de bonnes raisons de borner la distribution, elle est plutôt gaussienne (biologiquement notre taille ou notre poids max/mini sont limités).

+0 -0

Il faut prendre cette loi de Pareto comme un ordre de grandeur.

S’il avait dit "21% des sources provoquent 79% des résultats", ce serait une toute autre histoire. 21%, 79%, ce sont des nombres avec 2 chiffres significatifs. Et si on donne une statistique avec 2 chiffres significatifs, c’est que même le 2ème chiffre, on le considère comme significatif.

Pas fou, le Pareto, il a donné un seul chiffre significatif. Donc si pour tel ou tel jeu de données, on constate que 20% des sources produisent 85% des résultats, on est dans la plaque.

A l’usage, cette notion de 20–80 est entrée dans le vocabulaire courant de certaines professions. Demandez à un chef de rayon de votre hypermarché favori s’il connaît ses 20–80, il vous répondra certainement oui. Par contre, pas sûr du tout qu’il connaisse le nom de Pareto.

#toiAussiTrouveTonPareto

ça me fait penser à l'étude que j’avais faite sur les auteurs de ZdS.

En 2017, on avait 173 auteurs de contenus sur le site, pour un total de 641 contenus publiés.

Les 20% des auteurs (35 sur 173) avaient publiés un total de 426 (c’est à dire 66,5%) contenus de ZdS.

On est pas vraiment dans les 80/20, mais on reste bien dans l’idée générale qu’une minorité d’auteurs publient une majorité des contenus.

Le principe de Pareto est à ma connaissance associée aux distributions en loi de puissances, qui sont quelque chose d’un peu plus formel et utile que la version "grand public" du 80/20. Pereto est connu pour ses estimations de la distribution des revenus, et avoir montré la stabilité de la distribution dans le temps.

Le problème que je pointe du doigt (et qui se vérifie pour plein d’autres lois du même tonneau), c’est justement que ce qu’on appelle couramment la loi de Pareto (i.e. la version grand publique 80/20) est sortie de son contexte ultra-réduit de la distribution de Pareto qui va bien pour obtenir 80/20 et est du coup mentionnée dans des contextes qui n’ont pas grand chose à voir. Cette généralisation à la rache™ lui fait perdre de la puissance prédictive et donc de l’intérêt. Pour appuyer encore une fois, c’est la version grand publique que je critique, pas son cadre statistique précis d’origine.

Enfin, il n’y a rien d’évident à avoir des lois de puissances "pour n’importe quel processus où les agents ne sont pas identiques".

Du coup, c’est vachement bien que personne n’ait dit ça. Je parlais bien de la version plus générale mentionnée par society :

Elle dit juste que généralement une minorité de causes causent la majorité des effets.

Et ça, c’est comme je l’ai dit vérifié par n’importe quel processus avec des agents différents. C’est enfantin à comprendre, mettons que tu as un groupe de personnes qui sont plus ou moins efficaces pour faire un travail, et que cette efficacité suit la loi non homogène que tu veux (puissance, normale, bimodale, peu importe). On peut construire un groupe avec la moitié des gens les plus efficaces, et ce groupe tombera forcément la majorité du boulot.

A mon avis, les lois de puissances se retrouvent surtout dans les cas où la variable n’est pas bornée à une extrémité : revenu, force des tremblement de terre, variations boursières, nombres d’abonnés à une chaine youTube, etc. Quand il existe de bonnes raisons de borner la distribution, elle est plutôt gaussienne (biologiquement notre taille ou notre poids max/mini sont limités).

Demandred

Si je peux me permettre, c’est un avis qui me semble un peu naïf. Une gaussienne, c’est borné dans aucune des deux directions… Dire que la taille des gens suit une gaussienne, ça marche pas trop mal parce que la moyenne est loin des bornes possibles relativement à l’écart type (donc on se permet d’avoir une loi qui prédit une proportion très petite mais non nulle de gens qui ont une taille négative ou de plus de 5 mètres). De même, dire que l’énergie des tremblements de terre n’est pas bornée, ça me fait doucement rigoler, il y a une limite physique aux contraintes que tu peux accumuler. Difficile à évaluer précisément, certes, mais la limite existe et est probablement assez proche des plus gros séismes déjà observés (disons qu’avoir une magnitude 15, on sait que c’est impossible, mais 11 ou 12, c’est déjà plus discutable).

+0 -0

Le problème que je pointe du doigt, c’est justement que ce qu’on appelle couramment la loi de Pareto (i.e. la version grand publique 80/20) est sortie de son contexte ultra-réduit de la distribution de Pareto qui va bien pour obtenir 80/20.

Par association il arrive aussi de parler de distribution de Pareto pour des lois de puissances un peu différentes avec des coefs différentes de celle estimée par Pareto. Je n’y vois rien de bien méchant ni d’abusif. On dirait que si on parle de principe de Pareto pour quelque chose qui n’est pas exactement 80/20, ça te semble un énorme abus de langage !

Je parlais bien de la version plus générale mentionnée par society

C’est un peu pareil non ? Vu que les lois de puissances génèrent des distributions où une minorité d’événements comptent pour la majorité des variations. (Au chipotage prêt sur les autres types de lois de distributions qui ressemblent à des lois de puissances mais qui n’en sont pas, de toute façon empiriquement pour savoir qui est qui… Je vois venir :D ).

Une gaussienne, c’est borné dans aucune des deux directions…

Yep, enfin je pense que tu vois ce que je veux dire non ? :p C’est un peu un homme de paille que de faire remarquer que le monde est borné en réalité ou encore qu’il est discret alors qu’une loi gaussienne est continue…

+0 -0

On dirait que si on parle de principe de Pareto pour quelque chose qui n’est pas exactement 80/20, ça te semble un énorme abus de langage !

Il y a une différence entre parler de loi de Pareto pour un truc un peu éloigné mais pas trop (genre un phénomène avec une loi de puissance avec des coef un peu différent), et le mettre à toutes les sauces sans réfléchir comme dans les blogs qu’on peut trouver à la pelle sur Google (ou finalement, comme dans l’article alors que le premier résultat est un 91–3, mais là c’est pas problématique puisque c’est volontairement un test).

C’est un peu pareil non ? Vu que les lois de puissances génèrent des distributions où une minorité d’événements comptent pour la majorité des variations.

Ben non, tu raisonnes à l’envers. Les phénomènes gérés par lois de puissances sont pas les seuls où une minorité d’événements font la majorité des variations. Et en plus de ça, si on cherche à être un peu quantitatif, toutes les lois de puissances ne donnent pas un 80–20, et toutes les lois qui donnent un 80–20 ne sont pas des lois de puissances. Donc en gros, on se retrouve avec un fouillis complet de phénomènes différents sur lesquelles on va dans le meilleur des cas parler de loi de Pareto alors que ça n’a rien à voir, et dans le pire des cas faire une prise de décision sur du 80–20 alors que la réalité en est potentiellement très éloignée (même si on reste sur un phénomène en loi de puissance). Ce qui m’embête, c’est qu’on utilise un argument déjà pas hyper strict d’un point de vue mathématique (une loi empirique qui marche pour une classe de phénomène à condition de pas regarder de trop près), et pire, on le généralise sans prendre de gants à tout et n’importe quoi (avec un biais de confirmation énorme, on va jusqu’à déformer les données jusqu’à ce que ça passe !).

Yep, enfin je pense que tu vois ce que je veux dire non ? :p

Non. Je comprends pas du tout où tu veux en venir le passage que j’ai cité plus haut, ni le rapport avec le sujet. Mais je pense pas que ce soit très intéressant de s’y éterniser.

Pour moi, Pareto dit quoi : Vous avez des données de type 'comptage' (chaque ville, et sa population ; chaque pays, et son PIB etc etc ).

Vous voulez une vague estimation de la loi de répartition, sans trop investir de temps dans le recensement des données précises. Partez avec l’hypothèse 20–80, vous ne serez pas trop loin de la vérité. Basta.

Si on reprend l’exemple de Demandred avec les poids des individus (adultes de sexe masculin), ça marche, a condition de le prendre par le bon bout.

On a en gros 100 valeurs possibles (de 50kg à 150kg) ; Google me dit que le poids moyen d’un homme, c’est 77.4Kg, mais il ne me donne pas d’écart-type. Les 20 valeurs les plus fréquentes , ça doit probablement être les nombres entre 68 et 87, et donc, si on écoute Pareto, 80% des individus pèseraient entre 68kg et 87kg. Sans y passer 3 heures, j’ai un truc qui me permet d’avancer.

On prend des classes d’équivalences, et on cumule les effectifs des 20% des classes les plus peuplées.

Pris ainsi, on n’est pas très loin de la vérité. Par contre, dire que le poids cumulé des 20% d’adultes les plus lourds serait 80% du poids cumulé de tous les adultes, bien évidemment, non.

j’ai un truc qui me permet d’avancer.

… Pour faire quoi? Si tu veux faire un truc quantitatif, faudra y revenir proprement tôt ou tard, et si tu veux faire un truc pas quantitatif, dire que les gens pèsent entre 67 et 87 kg, ça se fait mieux en prenant une gaussienne et en disant qu’en 1 sigma (c’est 10 kg, le sigma), il y a 68% des gens. T’auras fait mieux qu’en prenant la première loi qui te tombe sous la main qui n’a pas de raison particulière de donner un truc pertinent. C’est un exemple typique de ce que je reproche au buzz autour de Pareto, on fonce bêtement sans réfléchir au fait qu’il y a peut être un truc plus pertinent.

Sauf qu’ici tu pars du postulat que tu connais le sigma. Et comme je l’avais écrit noir sur blanc, je ne dispose pas de ce sigma.

Je vais donc te paraphraser : C’est un exemple typique des gens qui critiquent l’utilisation de Pareto : on fonce bêtement sur une Gaussienne, sans voir qu’on n’a pas les éléments pour bâtir une gaussienne.

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte