Une étude de l'attractivité de Zeste de Savoir : le cas des auteurs

Essayer de comprendre si Zeste de Savoir parvient à attirer de nouveaux auteurs sur sa plateforme

Chers agrumes, récemment une conversation que j’ai pu lire sur Twitter m’a motivé à produire ce billet qui s’intéresse la situation des auteurs de Zeste de Savoir.

Le "fonds de commerce" de Zeste de Savoir est le partage du savoir. La plateforme met très souvent en avant l’aspect communautaire, mais quand on parle de chiffres on regarde trop souvent le nombre de membres sur le site ou encore le nombre de pages vues, mais on ne met pas toujours l’accent sur le nombre d’auteurs, qui produisent les contenus sur le site.

Je me suis donc lancé dans une étude assez modeste pour essayer de comprendre à quel point Zeste de Savoir est attractif pour les auteurs. Est-ce que le pari de l’ouverture (informatique, sciences, …) qu’a fait la plateforme incite à écrire concrètement ? La diversité des formats des contenus (tuto, article, billet) constituent-ils des catalyseurs d’écriture ? Quelle fonctionnalité de la plateforme a eu une influence notable sur l’arrivée de nouveau contributeurs ?

La suite du billet, commence par expliquer la méthode utilisée, puis présente les résultats des observations.

La méthode de travail

Les données utilisées pour cette méthode

Collecter l’information

J’avais besoin d’informations sur les auteurs de contenus, et n’ayant pas accès à la base de donnée du site (avec laquelle tout ceci aurait été plus pratique, mais moins fun) je me suis rabattu sur le scraping des pages du site. Je vois d’ici l’équipe technique qui me dévisage, mais ne vous inquiétez pas, je me suis contenté de bombarder le serveur de beta :p .

J’ai codé rapidement un script (ne faites pas trop attention à la propreté du code c’était un one shot) python3 qui matraque l’ensemble des pages de contenus pour extraire les métadonnées (date de publications, auteurs, catégories, …) utiles à mon étude.

L’exécution de mon script me permet donc d’avoir ces fichiers au format csv, qui sont l’ensemble des contenus publiés sur le site depuis sa création, avec leurs métadonnées.

Le traitement de l’information

C’est le moment le plus fun.

Avec les informations collectées, j’ai dû classer les catégories en domaines (SHS, Sciences de la nature, Informatique et Autres), et consolider le nombre d’auteurs cumulés toutes les semaines pour savoir comment ils ont évolués sur la durée.

Les limites de la méthode

  • L’étude se base uniquement sur les projets de rédaction qui ont abouti a quelque chose : les membres dont les projets d’écriture n’ont jamais passé la validation ne seront donc pas considérés dans cette étude
  • L’étude ne prend pas en compte l’historique de validation d’un contenu : c’est-à-dire qu’un contenu qui a subi une mise à jour majeure sera considéré comme ayant été publié a cette date pour la première fois. Notons que finalement ça a très peu d’impact sur les résultats obtenus.

L'évolution des auteurs dans chaque type de contenus

Zeste de Savoir permet aujourd’hui de rédiger dans trois types de contenus. Les tutoriels, les articles et les billets. Les articles et les tutoriels font partis des contenus qui sont validés par l’équipe et les billets sont des contenus qui ne sont pas passés par le filtre de la validation.

Je me suis lancé dans une représentation de l’évolution du nombre d’auteurs dans le temps en fonction du type de contenus.

Nombre d’auteurs par type de contenus

On peut faire quelques observations :

  • Le site possède tout de même près de 170 auteurs différents : je pense que de ce côté là, on peut en être fier. J’ignore les statistiques sur d’autres sites, mais pour une communauté de près de 8000 membres, je trouve ça formidable d’avoir autant d’auteurs qui publient quelque chose sur le site.
  • Il y a beaucoup plus d’auteurs de tutoriels que d’auteurs d’articles 1 : Et pourtant on sait bien qu’arriver au bout d’un tutoriel est bien plus compliqué que d’arriver au bout d’un article, mais ça n’a pas l’air d’être un frein pour certains auteurs.
  • Comme on peut le voir sur les courbes violette (tous les auteurs) et bleu (auteurs de billets), le format "billet" est parvenu à attirer de nouveaux auteurs sur le site.
  • En comparant la ligne orange (auteurs d’articles) et bleu (auteurs de billets), on se rend compte que les articles attirent moins d’auteurs depuis l’arrivée des tribunes.

  1. En même temps il y a beaucoup plus de tutoriels publiés que d’articles. 

L'évolution des auteurs dans chaque domaine de savoir

La particularité de Zeste de Savoir est de ne pas se limiter à une seule discipline. Sur ce site il y a trois gros domaines de savoir : Les sciences de la nature, les sciences humaines et sociales, et l’informatique. Tout le reste est classé dans "Les autres".

Il est donc intéressant de savoir si le pari de la pluridisciplinarité de Zeste de Savoir est payant. Et si les auteurs sont réceptifs à cette ouverture.

Evolution des auteurs par domaine de savoir

Ces courbes nous apprennent certaines choses :

  • Il y a beaucoup plus d’auteurs en informatique qu’ailleurs et ils évoluent beaucoup plus vite que dans les autres domaines : on sent que la communauté est formée essentiellement d’auteurs en informatique.
  • C’est un peu la misère chez les auteurs en SHS. Il y a eu un sursaut en mi 2016, qui a permis de remettre la courbe sur de bon rails, mais il y a encore du boulot. Aujourd’hui en SHS, en 2017, on arrive à peine à faire aussi bien que la section informatique en fin 2014.
  • La section "Autres" semble attirer beaucoup plus d’auteurs que la section sciences de la nature. Il serait peut-être intéressant de savoir si l’on ne devrait pas extraire quelque chose de plus précis dans ce domaine "Autres"

L'impact de la technique et de la communication sur l'arrivée d'auteurs

Maintenant nous nous intéressons à l’impact d’éléments externes (techniques, communication) sur l’arrivée de nouveaux auteurs sur Zeste de Savoir.

J’ai identifié, depuis la création du site, plusieurs mesures qui ont été prises pour encourager la production de contenu, et attirer de nouveaux auteurs. Il y a eu :

  • Les concentrés de savoirs: l’idée était d’organiser des gros mouvements de rédaction communautaires autour d’un thème.
  • La nouvelle page d’accueil : qui permettait de mettre en avant des contenus. Un élément de communication fort qui pourrait encourager de nouveaux auteurs à se lancer.
  • La ZEP 12 : qui permettait d’introduire un format de tutoriel "moyen" et qui répondait à un besoin des auteurs.
  • Le Capitole du Libre : une grosse présence de Zeste de Savoir lors d’un événement IRL qui a permis de communiquer sur Zeste de Savoir de manière large.
  • Le lancement des tribunes libres : une demande des auteurs aussi qui souhaitaient s’exprimer dans un autre format.

En posant sur les courbes précédentes les dates d’arrivée des éléments externes, on peut faire certaines observations, et confirmer/infirmer si elles ont eu un impact sur l’arrivée des nouveaux auteurs.

Les résultats restent tout de même à prendre avec des pincettes, car entre le moment ou le contenu est envoyé en validation et le moment ou ce dernier est publié il peut s’en passer des semaines et parfois des mois.

Auteurs par domaine annoté
Auteurs par type annoté

Qu’est-ce qu’on peut voir dans tout ceci ?

  • L’arrivée des tribunes libres a donné un coup de boost aux auteurs en informatique. La courbe des auteurs en informatique s’est tendue encore plus dans le bon sens. On voit aussi que les tribunes on un impact non négligeable sur des auteurs de contenus de type "Autres". Par contre, les billets ne semblent pas avoir changé les habitudes des scientifiques.
  • Le premier concentré de savoir a été très bénéfique pour les scientifiques. Le deuxième a été moins attractif pour de nouveaux auteurs de manière générale.
  • Quelque chose s’est passé en 2016, mais je n’arrive pas à mettre la main dessus.

Les auteurs de Zeste de Savoir sont-ils fidèles ?

Maintenant on va s’intéresser à la question de savoir si les auteurs du site rédigent juste une fois et quittent le navire, ou est-ce que leur première expérience les pousse à renouveler la chose.

Pour cela, j’ai construit un diagramme2 qui montre en abscisse le nombre de contenus publiés, et en ordonnée, le nombre d’auteurs qui ont publiés autant de contenus.

Nombre de contenus publiés par les auteurs

Pour ceux qui ont du mal à lire le graphique, la première barre signifie qu’il y a 91 auteurs qui ont publié un seul contenu sur le site, la seconde barre signifie qu’il y a 23 auteurs qui ont publié deux contenus sur le site, et ainsi de suite.

On peut faire les observations suivantes :

  • Un peu plus de la moitié de nos auteurs publient un contenu et ciao, bye bye. Ils ne renouvellent pas l’expérience.
  • On a pas mal d’auteurs qui ne s’arrêtent pas à leur première expérience, c’est très encourageant. On arrive à fidéliser un peu moins de la moitié de nos auteurs.

J’en profite pour nommer les cinq plus gros1 auteurs sur ce site.

Auteur Nombre de contenus (tutoriel, article ou billet) publiés sur Zeste de Savoir
Eskimon 32
SpaceFox 30
Arius 24
victor 20
Gabbro 20

Un grand merci à eux.


  1. Gros en nombre de contenus publiés, ce qui peut être différent des gros auteurs en volume de contenu. 

  2. Fichier csv contenant la liste des auteurs et le nombre de contenus publiés 

Qu'en est-il du rythme de publication dans tout ça ?

Pour remettre tout ceci en perspective avec les publications, un graphique qui montre l’évolution des contenus publiés par rapport à l’arrivée des auteurs.

Nombre de publications vs Nombre d’auteurs

Les tribunes libres, en plus d’attirer des auteurs ont aussi permis de faire décoller franchement le nombre de contenus publiés sur la plateforme.


On pourrait continuer à chercher des choses à partir de ces données, mais ce billet commençait vraiment à devenir très long. C’est pour cela que je fournis les données en entrée sur lesquels je me base pour ceux qui souhaitent faire des analyses plus poussées1:.

Quoiqu’il en soit, au terme de ce billet, la seule chose que l’on puisse dire avec certitude est que , dans l’ensemble, sur la plateforme Zeste de Savoir, le nombre d’auteurs évolue à un rythme régulier depuis le départ. Je n’ai pas pu trouver dans les opérations qui ont été menés jusqu’aujourd’hui un réel booster d’auteurs. Ce qui semble avoir le mieux marché dans l’ensemble est l’arrivée des tribunes libres qui ont amené de nouveaux auteurs de manière générale.

Il reste tout de même du travail à faire pour pousser les auteurs à renouveler leur expérience d’écriture.

Je terminerai donc sur cette question qui s’adresse surtout aux auteurs  :

Qu’est-ce qui vous a motivé au départ à publier sur Zeste de Savoir ? Et pourquoi avez-vous/n’avez-vous pas renouvelé l’expérience ?


  1. On pourrait par exemple réaliser le même travail sur les données d’un autre site communautaire histoire d’avoir des points de comparaison. 

37 commentaires

Quelles en sont les raisons ? Uniquement celles mentionnées ici ou d’autres ?

Arius

Je vois pas l’intérêt d’entrer dans les détails. Il y a la partie validation qui a été tellement pénible que ça a failli ne jamais être publié d’abord, puis menacé d’être dépublié sitôt après. Et il y a la partie "outil de rédaction" qui est mal foutu.

+1 -2

Qu’est-ce qui vous a motivé au départ à publier sur Zeste de Savoir ?

Le fait de créer et de partager. Le besoin de rédiger aussi sans doute.

À l’époque, cela faisait un peu plus d’un an que j’étais entré dans le monde de la programmation, je découvrais ZdS qui naissait tout juste, et tout ça me donnait vraiment envie d’écrire quelque chose de mes petites pattes.

Et pourquoi avez-vous/n’avez-vous pas renouvelé l’expérience ?

L’expérience n’a pas forcément été facile, surtout au départ, et ce même si je pense avoir fait les choses dans l’ordre. Cela demande de l’investissement (des dizaines d’heure parfois), de la remise en question et de la patience (souvenirs de mon premier tuto mis en validation par ex). Les choses ne vont pas toujours comme on veut, mais ça fait partie du jeu. Au fur et à mesure, on apprend et on fait de mieux en mieux. Et un puis un jour, on reçoit un mp nous invitant à prendre un smoothie ; alors on ressent une joie intérieure et on se dit qu’on ne peut pas s’arrêter en si bon chemin. Et on recommence, toujours en apprenant et en faisant de mieux en mieux.

Avec du recul, je pense vraiment que le processus mis en place aujourd’hui sur ZdS est bon et permet l’amélioration continu pour chaque acteur.

Et si avant le manque d’informations pouvait être handicapant pour un débutant, il y a désormais un cheatcode pour enlever le brouillard de guerre.

Ce qui me chagrine le plus en temps qu’auteur non débutant, c’est deux choses :

  • le manque de statistiques ; personnellement, je me questionne sur l’utilité de mes écrits ; c’est bien de se faire kiffer, mais si au final y’a pas de lecteurs, on se dit qu’on ferait mieux de reprendre notre collection de trombones de bureau qui commence à prendre la poussière ; parce que une fois passées les 2-3 semaines après la publication et donc les réactions dans les commentaires il ne reste plus grand chose pour nous dire si le contenu est lu ou non (un mp de temps en temps ou bien un autre commentaire pour les plus chanceux).
  • l’export en pdf ; ça c’est peut-être plus un caprice, mais c’est dommage qu’il n’ait plus ce format stratégique.

Si j’ai plus ou moins arrêté la rédaction, c’est par manque de vision sur le lectorat, la lassitude, et l’envie de faire d’autres choses.

  • le manque de statistiques ; personnellement, je me questionne sur l’utilité de mes écrits ; c’est bien de se faire kiffer, mais si au final y’a pas de lecteurs, on se dit qu’on ferait mieux de reprendre notre collection de trombones de bureau qui commence à prendre la poussière ; parce que une fois passées les 2-3 semaines après la publication et donc les réactions dans les commentaires il ne reste plus grand chose pour nous dire si le contenu est lu ou non (un mp de temps en temps ou bien un autre commentaire pour les plus chanceux).
Smokiev

Ça, je suis tout à fait d’accord ! C’est très difficile de savoir si la publi a vraiment intéressé des gens, et surtout des gens qui a priori ne sont pas déjà renseignés sur le sujet.

Le plus souvent, surtout pour les petits tutoriels (et maintenant pour les articles), les principaux retours proviennent de lecteurs qui connaissent déjà un peu le sujet qui avaient envie de se rafraîchir la mémoire ou d’approfondir. Ce public est déjà assez limité en soi, et il est assez dur (voire impossible à l’heure actuelle ?) de savoir combien de lecteurs qui ne connaissaient pas le sujet vont jusqu’au bout de la lecture, et la terminent avec l’impression d’avoir acquis un savoir nouveau.

Je suis assez d’accord avec le manque de statistiques, tout en étant partagé sur leur utilité réelle. Mais ça nécessiterait un développement que je n’ai pas le temps de faire.

Par contre :

l’export en pdf ; ça c’est peut-être plus un caprice, mais c’est dommage qu’il n’ait plus ce format stratégique.

Je me souviens avoir fouillé les logs quand les premières grosses merdes sont apparues avec les générations de PDF. Et en réalité, ce format était très rarement utilisé.

Je suis assez d’accord avec le manque de statistiques, tout en étant partagé sur leur utilité réelle. Mais ça nécessiterait un développement que je n’ai pas le temps de faire.

SpaceFox

Ça permettrait déjà de voir la réception et l’évolution de la fréquentation d’un contenu. Cela peut paraître simple et bête, mais un petit compteur de vues (même si ce n’est pas une donnée très parlante), pas forcément visible au lecteur, me rendrait déjà heureux. J’aurais ainsi quelque chose de visible et tangible à me mettre sous la dent. À mon sens, ça ne peut que motiver si on voit que ce que l’on fait sert, évolue, à un impact. À l’inverse, si on voit que ça ne prend pas, ça peut démotiver.

À l’heure actuelle c’est le noir complet, mais quelques fois des chiffres, phares dans le noir, éblouissent :

Du coup je peux que te répondre pour la semaine écoulée. Sur l’ensemble des URLs en /tutoriels/, le tuto arduino fait 32.8% des pages vues. Le suivant est API REST Symfony 3 avec 10.4%, puis Administrez vos BDD MySQL avec 4.2%.

victor

C’est des pourcentages, donc ce n’est pas parlant en terme de quantité de pages vues. Et c’est sur une semaine, donc ce n’est pas forcément représentatif. Mais 3 tutoriels qui font 50%, ça fait réfléchir sur la fréquentation des autres.

Après, j’avoue que je n’ai pas plus réfléchi à la question que ça. Il y a sans doutes plein de possibilités (voir ceux qui vont au bout ou encore chercher le feedback comme le suggère c_pages). Je sais qu’il y a une ZEP et des tentatives de réalisation.

Il y a sans doute des petites choses à faire, à tester, sans chercher l’usine à gaz.

Par contre :

l’export en pdf ; ça c’est peut-être plus un caprice, mais c’est dommage qu’il n’ait plus ce format stratégique.

Je me souviens avoir fouillé les logs quand les premières grosses merdes sont apparues avec les générations de PDF. Et en réalité, ce format était très rarement utilisé.

SpaceFox

D’autres formats étaient davantage téléchargés ou c’était simplement le taux de téléchargement qui était faible ? Peut-être que la fréquentation du site (nombre de visiteurs, types de visiteurs) ne se prêtait et ne prête pas encore assez à cette utilisation ? Ou encore vu qu’aujourd’hui on tend à être sans cesse connecté (encore plus quand on est une communauté de geeks), rien ne vaut un bon vieux navigateur ?

Je sais que personnellement j’aimais bien télécharger des contenus (d’ici ou ailleurs) pour les avoir hors-ligne et les lire dans le train par exemple.

Concernant les stats, je pense que si on compte les vues, il faudrait au moins tenir en compte du temps. C’est à dire que je pense que “Ce tutoriel a été vu 36 fois depuis sa création” est beaucoup moins parlant que “Ce tutoriel a été vu 17 fois au cours des 7 derniers jours”. Et pour faire ça, je ne vois pas d’autre solution qu’utiliser des séries temporelles. Et je ne crois pas que MySQL (la BDD utilisée sur ce site) soit vraiment faite pour ça, je crois qu’il vaut mieux utiliser InfluxDB ou autre (à voir en fonction de la charge et tout). Bref, il faut demander à des connaisseurs, aux gens qui maintiennent le backend et aux sysadmins qui gèrent la production.

Du coup je peux que te répondre pour la semaine écoulée. Sur l’ensemble des URLs en /tutoriels/, le tuto arduino fait 32.8% des pages vues. Le suivant est API REST Symfony 3 avec 10.4%, puis Administrez vos BDD MySQL avec 4.2%.

victor

C’est des pourcentages, donc ce n’est pas parlant en terme de quantité de pages vues. Et c’est sur une semaine, donc ce n’est pas forcément représentatif. Mais 3 tutoriels qui font 50%, ça fait réfléchir sur la fréquentation des autres.

Smokiev

3 derniers mois :

+4 -0

Du coup je peux que te répondre pour la semaine écoulée. Sur l’ensemble des URLs en /tutoriels/, le tuto arduino fait 32.8% des pages vues. Le suivant est API REST Symfony 3 avec 10.4%, puis Administrez vos BDD MySQL avec 4.2%.

victor

C’est des pourcentages, donc ce n’est pas parlant en terme de quantité de pages vues. Et c’est sur une semaine, donc ce n’est pas forcément représentatif. Mais 3 tutoriels qui font 50%, ça fait réfléchir sur la fréquentation des autres.

Smokiev

3 derniers mois :

victor

Cool, trois de mes articles sont présent \o/ ça motive vachement ^^

+0 -0

En avoir un dans chaque classement, c’est déjà assez motivant, même si ça ne représente qu’1,5% des visites.

entwanne

Je sais pas comment tu es arrivé à ce 1.5%, mais ça risque d’être assez loin de la réalité. ;)

Les 2 tables que j’ai mises sont limitées aux 10 premières entrées et ne montrent pas les totaux. (Je dis absolument pas ça pour décourager, et je trouve tes contenus excellents.)

+0 -0

Ah ? J’ai vu que 30577÷147070 (le total qui apparaît sur ton premier graphique) retombait bien sur 20,8%, donc j’ai calculé le pourcentage en reprenant le nombre de vues du tutoriel (ça ne prend donc pas en compte les articles).

Je trouve ça très intéressants tout ces retours d’auteurs. Si je puis me permettre un résumé, on peut le voir de cette façon :

  • Ce qui a poussé les auteurs à se lancer dans un projet d’écriture sur ZdS c’est :

  • Ce qui a empêché le renouvellement de l’expérience c’est surtout:

    • Des problèmes humains :
      • La difficulté de satisfaire une communauté telle que celle de ZdS qui est très variée (source 1, source 2, source 3)
      • Le manque de temps/paresse (Source 1 )
      • Le manque d’inspiration (Source 1 )
      • Le processus de validation qui peut se révéler long et pénible (source 1)
    • Des problèmes techniques :

De ce que j’en comprends, il y a encore pas mal de boulot pour attirer des auteurs. Le boulot n’est pas seulement du domaine de la technique, mais on a aussi des efforts à faire au niveau humain/organisationnel (c’est pour cela que je salue des initiatives comme les défis de clem).

Merci pour le résumé, firm1.

  • Le processus de validation qui peut se révéler long et pénible (source 1)
firm1

Dans mon cas, vu que tu l’utilises comme source, c’était pas du tout long pour que ce soit publié, 1 semaine max. La partie vraiment longue et pénible c’étaient les menaces de validateurs de dépublier mon contenu alors qu’il était déjà validé et publié. C’était ça que j’ai trouvé le plus désagréable, et c’est ça qui a trainé en longueur.

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte