Re-calibrer les durées estimées de lecture ?

a marqué ce sujet comme résolu.

Salut les agrumes,

Sur nos publications, on a une durée estimée de lecture. Mais j’ai l’impression que la valeur utilisée est très conservatrice, ce qui donne des temps de lecture très supérieurs au temps de lecture « normal » constaté par les lecteurs (cf par exemple ici). Ça peut donc effrayer les lecteurs qui arriveraient sur nos pages.

Peut-être qu’on aurait intérêt à corriger la métrique utilisée pour obtenir des temps de lecture plus proches de ce qui est constaté ?

Alors, c’est calibré à combien de mots par minute ?

Ce que je propose :

  • exclure les images du compte des caractères ;
  • idem pour les notes de bas de page ;
+3 -0

on prend le nombre de caractère, on le multiplie par le nombre moyen de caractère lus en une minute par une personne et on lui applique un certain facteur qui est fonction de la structure du tutoriel.

Dans le cadre de cet article, le "certain facteur" est de 1 donc c’est pas ça le problème, c’est juste que le nombre de caractères est important.

Ce serais pas mieux de calculer avec le nombre de mot plutôt quel nombre de caractères ? Dans le sens ou la lecture n’est pas, du moins il me semble, quelque chose qu’on fait caractère par caractère.

+1 -0

Ce serais pas mieux de calculer avec le nombre de mot plutôt quel nombre de caractères ? Dans le sens ou la lecture n’est pas, du moins il me semble, quelque chose qu’on fait caractère par caractère.

LudoBike

Ça change pas grand chose, le nombre de caractères des mots suit une loi normale. Pour peu qu’on divise par la moyenne, ça donne la même chose pour un extrait avec une centaine de mots.

Ça change pas grand chose, le nombre de caractères des mots suit une loi normale.

Dans le nombre de mots d’une langue ou dans des vrais textes ? J’aurai pensé qu’il y a beaucoup plus de mots courts que de mots longs dans un texte. Et comme la fréquence d’utilisation des mots suit une loi de puissance, ça m’a l’air plus compliqué que ça non ?

+0 -0

N’importe. Je me rappelle d’une discussion avec KFC sur IRC il y a quelques mois (voire années?) où on en avait discuté.

J’aurai pensé qu’il y a beaucoup plus de mots courts que de mots longs dans un texte.

Même si c’est vrai, ça n’empêche que ça suit une loi normale, et c’est le plus important. En gérant juste le coefficient de lecture, on gère tout à la fois, pas besoin d’intégrer un autre facteur.

Avant de partir dans des considérations sur le comment, est-t-on sûr du problème ? Est-ce moi seulement qui aie mis nettement moins de temps qu’annoncé ou est-ce général ?

J’ai cherché vite fait, et les chiffres que je trouve sont les suivants : environ 200 à 350 mots par minutes1, 5 caractères par mot (espaces et ponctuation non compris). Ça fait donc entre 1200 et 2500 (200 mots/minutes de 5 caractères + 1 espace et ponctuation, 350 mots/minutes de 5 caractères + 2 espaces et ponctuation) caractères par minutes.

Le compteur est mis à 1500, ce qui est un peu bas.

J’ai vérifié (par un copié-collé dans libreoffice) combien de mot comprenait l’article : environ 8800, soit 25 minutes à 350 mots/minutes et 45 minutes à 200 mots/minutes.

À l’évidence, le compteur prend trop de caractères (les images ? la mise en forme ?).

Si je ne suis pas le seul à lire plus vite que le compteur, je vois 3 solutions :

  • Supprimer la mise en forme et les images du décompte des caractères (ou imposer un temps fixe par image) ;
  • Passer à un compte par mot (il y a bien une bibliothèque qui fait ça, j’imagine ?) ;
  • Passer la vitesse de lecture à 3000 caractères par minutes, ce qui est trop, mais devrait se moyenner avec les caractères surnuméraires. :-°

Adepte de la simplicité, je propose le 3 car ça devrait suffire dans 90 % des cas. :-°


  1. Je me fais facilement dépasser en vitesse de lecture par plusieurs connaissances, mais je reste un gros lecteur par rapport à la moyenne de la population. Je suis plus prêt des 350 que des 200 (c’est école primaire, le 200), à priori. 

+6 -0

Le système de comptage mesure-t-il le temps sur le texte en markdown, sur le HTML où sur autre chose ? Si il le mesure sur le HTML, il y a forcément trop de caractères, et donc un temps de lecture surestimé. Si il le mesure sur le markdown, il reste quand même beaucoup de caractères de markup, en particulier pour les images, les blocs spéciaux, les tableaux, les formules mathématiques… Donc il y a trop de caractères comptés.

À mon avis, il faudrait compter les caractères sur le texte brut de l’article, sans les caractères de markup (les liens, les *, les _, etc.) Il faudrait donc avoir un moyen de ne récupérer que ce texte brut via zmarkdown.

Ou alors, baser ce temps estimé non seulement sur le nombre de caractères, mais aussi sur le temps qu’un lecteur met à le lire.

+1 -1

Juste pour ajouter de l’eau au moulin, je viens de faire une re-lecture d’une nouvelle que j’écris, et par curiosité, je me suis chronométré.

Donc, un lecteur plutôt rapide mais concentré sur une tâche de relecture (échantillon très représentatif de 1 lecture et de 1 personne…) tourne à 220 mots/minute (1350 SEC/minute avec près de 6 SEC/mot, mais sans que ça tienne compte de la mise en forme).

Du coup ça me met le doute parce que c’est carrément plus lent que ce que je pensais… Nos chiffres semblent cohérents (modulo la mise en page qui nous bouffe des caractères) avec une lecture attentive. Mais je ne sais pas si ça s’applique vraiment à nos contenus.

Des volontaires pour faire des expériences ?

Des volontaires pour faire des expériences ?

SpaceFox

Je pense que soit la formule est peu performante sur les trucs courts, soit elle donne trop de poids aux 4 images de cet article (si elles sont prises en compte). L’hypothèse que je lise >3x plus vite que la moyenne me semble farfelue.

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte