Re-calibrer les durées estimées de lecture ?

a marqué ce sujet comme résolu.
Auteur du sujet

Salut les agrumes,

Sur nos publications, on a une durée estimée de lecture. Mais j’ai l’impression que la valeur utilisée est très conservatrice, ce qui donne des temps de lecture très supérieurs au temps de lecture « normal » constaté par les lecteurs (cf par exemple ici). Ça peut donc effrayer les lecteurs qui arriveraient sur nos pages.

Peut-être qu’on aurait intérêt à corriger la métrique utilisée pour obtenir des temps de lecture plus proches de ce qui est constaté ?

Alors, c’est calibré à combien de mots par minute ?

Ce que je propose :

  • exclure les images du compte des caractères ;
  • idem pour les notes de bas de page ;

La tero estas nur unu lando | Géographe de service | Cliquez 👍 pour dire merci

+3 -0

exclure les images du compte des caractères 

Je sais plus si c’est déjà le cas ou pas, mais dans l’absolu regarder une image prend du temps. À voir si c’est pas plus logique de les laisser (bon, évidement, le temps passé sur une image ne dépend pas de la taille de l’adresse comme c’est le cas ici).

#JeSuisToujoursArius • Doctorant et assistant en chimiedev' à temps partiel (co-réalisateur ZEP-12, recherche et template LaTeX)

+2 -0

on prend le nombre de caractère, on le multiplie par le nombre moyen de caractère lus en une minute par une personne et on lui applique un certain facteur qui est fonction de la structure du tutoriel.

Dans le cadre de cet article, le "certain facteur" est de 1 donc c’est pas ça le problème, c’est juste que le nombre de caractères est important.

+1 -0

Ce serais pas mieux de calculer avec le nombre de mot plutôt quel nombre de caractères ? Dans le sens ou la lecture n’est pas, du moins il me semble, quelque chose qu’on fait caractère par caractère.

« La Nature est un livre écrit en langage mathématique », Galilée

+1 -0

Ce serais pas mieux de calculer avec le nombre de mot plutôt quel nombre de caractères ? Dans le sens ou la lecture n’est pas, du moins il me semble, quelque chose qu’on fait caractère par caractère.

LudoBike

Ça change pas grand chose, le nombre de caractères des mots suit une loi normale. Pour peu qu’on divise par la moyenne, ça donne la même chose pour un extrait avec une centaine de mots.

+3 -0

Ça change pas grand chose, le nombre de caractères des mots suit une loi normale.

Dans le nombre de mots d’une langue ou dans des vrais textes ? J’aurai pensé qu’il y a beaucoup plus de mots courts que de mots longs dans un texte. Et comme la fréquence d’utilisation des mots suit une loi de puissance, ça m’a l’air plus compliqué que ça non ?

“Your manuscript is both good and original. But the part that is good is not original, and the part that is original is not good.” Samuel Johnson

+0 -0

N’importe. Je me rappelle d’une discussion avec KFC sur IRC il y a quelques mois (voire années?) où on en avait discuté.

J’aurai pensé qu’il y a beaucoup plus de mots courts que de mots longs dans un texte.

Même si c’est vrai, ça n’empêche que ça suit une loi normale, et c’est le plus important. En gérant juste le coefficient de lecture, on gère tout à la fois, pas besoin d’intégrer un autre facteur.

+1 -0

Avant de partir dans des considérations sur le comment, est-t-on sûr du problème ? Est-ce moi seulement qui aie mis nettement moins de temps qu’annoncé ou est-ce général ?

J’ai cherché vite fait, et les chiffres que je trouve sont les suivants : environ 200 à 350 mots par minutes1, 5 caractères par mot (espaces et ponctuation non compris). Ça fait donc entre 1200 et 2500 (200 mots/minutes de 5 caractères + 1 espace et ponctuation, 350 mots/minutes de 5 caractères + 2 espaces et ponctuation) caractères par minutes.

Le compteur est mis à 1500, ce qui est un peu bas.

J’ai vérifié (par un copié-collé dans libreoffice) combien de mot comprenait l’article : environ 8800, soit 25 minutes à 350 mots/minutes et 45 minutes à 200 mots/minutes.

À l’évidence, le compteur prend trop de caractères (les images ? la mise en forme ?).

Si je ne suis pas le seul à lire plus vite que le compteur, je vois 3 solutions :

  • Supprimer la mise en forme et les images du décompte des caractères (ou imposer un temps fixe par image) ;
  • Passer à un compte par mot (il y a bien une bibliothèque qui fait ça, j’imagine ?) ;
  • Passer la vitesse de lecture à 3000 caractères par minutes, ce qui est trop, mais devrait se moyenner avec les caractères surnuméraires. :-°

Adepte de la simplicité, je propose le 3 car ça devrait suffire dans 90 % des cas. :-°


  1. Je me fais facilement dépasser en vitesse de lecture par plusieurs connaissances, mais je reste un gros lecteur par rapport à la moyenne de la population. Je suis plus prêt des 350 que des 200 (c’est école primaire, le 200), à priori. 

Édité par Gabbro

Hier, dans le parc, j’ai vu une petite vieille entourée de dinosaures aviens. Je donne pas cher de sa peau.

+6 -0

Sans compter ceux lisant en diagonal.

qwerty

Oui, enfin un temps de lecture c’est un temps de lecture, pas un temps de survol… :-°

I don’t mind that you think slowly, but I do mind that you are publishing faster. — W. Pauli

+5 -0

Le système de comptage mesure-t-il le temps sur le texte en markdown, sur le HTML où sur autre chose ? Si il le mesure sur le HTML, il y a forcément trop de caractères, et donc un temps de lecture surestimé. Si il le mesure sur le markdown, il reste quand même beaucoup de caractères de markup, en particulier pour les images, les blocs spéciaux, les tableaux, les formules mathématiques… Donc il y a trop de caractères comptés.

À mon avis, il faudrait compter les caractères sur le texte brut de l’article, sans les caractères de markup (les liens, les *, les _, etc.) Il faudrait donc avoir un moyen de ne récupérer que ce texte brut via zmarkdown.

Ou alors, baser ce temps estimé non seulement sur le nombre de caractères, mais aussi sur le temps qu’un lecteur met à le lire.

Édité par amael

Ils ne savaient pas que c’était impossible alors ils l’ont fait Mark Twain

+1 -1
Auteur du sujet

Juste pour ajouter de l’eau au moulin, je viens de faire une re-lecture d’une nouvelle que j’écris, et par curiosité, je me suis chronométré.

Donc, un lecteur plutôt rapide mais concentré sur une tâche de relecture (échantillon très représentatif de 1 lecture et de 1 personne…) tourne à 220 mots/minute (1350 SEC/minute avec près de 6 SEC/mot, mais sans que ça tienne compte de la mise en forme).

Du coup ça me met le doute parce que c’est carrément plus lent que ce que je pensais… Nos chiffres semblent cohérents (modulo la mise en page qui nous bouffe des caractères) avec une lecture attentive. Mais je ne sais pas si ça s’applique vraiment à nos contenus.

Des volontaires pour faire des expériences ?

Des volontaires pour faire des expériences ?

SpaceFox

Je pense que soit la formule est peu performante sur les trucs courts, soit elle donne trop de poids aux 4 images de cet article (si elles sont prises en compte). L’hypothèse que je lise >3x plus vite que la moyenne me semble farfelue.

Vous aimez le frontend ? Il y a un tas de petites tâches faciles si vous voulez contribuer à ZdS : https://github.com/zestedesavoir/zds-site/issues?q=is%3Aissue+is%3Aopen+label%3AC-Front

+0 -0
Vous devez être connecté pour pouvoir poster un message.
Connexion

Pas encore inscrit ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte