Les arbres de décisions

Ce cours explique les bases des arbres de décisions (ID3 et C4.5) avec une implémentation en Python3

a marqué ce sujet comme résolu.

Malheureusement, ce tutoriel qui était en bêta a été supprimé par son auteur.

Bonjour à tous,

J'ai commencé (il y a 4 mois) la rédaction d'un tutoriel dont l'intitulé est Les arbres de décisions.

J'aimerai obtenir un maximum de retour sur celui-ci, sur le fond ainsi que sur la forme, afin de proposer en validation un texte de qualité.

Si vous êtes intéressé, cliquez ci-dessous

Merci d'avance pour votre aide

+0 -0

Salut,

Je ne peux pas parler du contenu, parce que je n'y connais rien, et que j'ai lu en travers.

Par contre, j'ai des remarques sur la forme :

  • la figure avec le tracé de l'entropie est immense (il est presque plus haut que mon écran) et les axes sont minuscules ;
  • les schéma avec les arbres ont un rendu dégueulasse à mes yeux : la police ajourée est pas incroyable pour un schéma, et en plus, tu as deux autres polices, dont une type manuscript qui est étrange sur un schéma ;
  • il faut que tu trouves une solution pour les grandes formules, parce qu'elles sont rendues sur plusieurs lignes chez moi ;
  • les Nuageux, Vent et autres noms écrits en mode mathématique au sein du texte cassent la hauteur de ligne, et font un rendu un peu impropre.

Voilà ! Bonne continuation.

+0 -0
  • la figure avec le tracé de l'entropie est immense (il est presque plus haut que mon écran) et les axes sont minuscules ;

Que proposes-tu ? De diminuer les dimensions de l'image et grossir les axes donc pour plus de lisibilité ?

  • les schéma avec les arbres ont un rendu dégueulasse à mes yeux : la police ajourée est pas incroyable pour un schéma, et en plus, tu as deux autres polices, dont une type manuscript qui est étrange sur un schéma ;

Qu'entends-tu par police ajourée ? A nouveau, que proposes-tu ? D'uniformiser la police d'écriture ou simplement d'en changer certaines ?

  • il faut que tu trouves une solution pour les grandes formules, parce qu'elles sont rendues sur plusieurs lignes chez moi ;

C'est un bug que j'ai déjà signalé ici. Je vais probablement devoir faire un hack pour un affichage correct, ce serait dommage.

  • les Nuageux, Vent et autres noms écrits en mode mathématique au sein du texte cassent la hauteur de ligne, et font un rendu un peu impropre.

Je trouvais justement que ça aidait à repérer quand des termes précis ayant un sens important étaient utilisés. J'aimerais avoir d'autres avis là-dessus pour savoir que faire.

Voilà ! Bonne continuation.

Merci beaucoup de m'avoir lu ! :)

+0 -0

Que proposes-tu ? De diminuer les dimensions de l'image et grossir les axes donc pour plus de lisibilité ?

Oui, je pense que ça devrait le faire.

Qu'entends-tu par police ajourée ? A nouveau, que proposes-tu ? D'uniformiser la police d'écriture ou simplement d'en changer certaines ?

Une police ajourée, c'est ça : $\mathbb{ABCDEF...}$. C'est pas très lisible.

  • les Nuageux, Vent et autres noms écrits en mode mathématique au sein du texte cassent la hauteur de ligne, et font un rendu un peu impropre.

Je trouvais justement que ça aidait à repérer quand des termes précis ayant un sens important étaient utilisés. J'aimerais avoir d'autres avis là-dessus pour savoir que faire.

Sinon, essaie italique, gras ou code inline.

Oui, je pense que ça devrait le faire. […] Une police ajourée, c'est ça : $\mathbb{ABCDEF...}$. C'est pas très lisible.

Ok je retravaillerai les illustrations alors.

Sinon, essaie italique, gras ou code inline.

Le code m'ouais. Ce que je trouvais bien, c'était de récupérer la police mathématique utilisée dans les formules pour ces mêmes mots.

+0 -0

Pour les citations, choisis les chevrons doubles ou l'italique, mais pas les 2

Tes nombres dans le texte sont en latex ? C'est moche, la police n'est pas de la même taille. Limite l'utilisation du Latex aux formules.

C'est toi qui a donner cette taille au Latex ou c'est par défaut dans ZdS ? Il faudrait diminuer la taille (idéalement, les formules inline devrait avoir la même taille que le texte). Aérer un peu les formules (interline plus grand ?) Et je suis pas fan des formules inline en général, cela alourdie la lecture.

Pour le code, limite la largeur (pour que cela reste dans l'écran sans devoir scroller). Donner le code ne sert à rien (tu donnes des explications sur la méthode, c'est le sujet de l'article. Mais mettre le code comme ça, sans explication, bof. Un lien vers github est suffisant. Si tu veux mettre le code, il vaudrait mieux écrire une partie "comment implémenter" et analyser les problématiques liées à l'implémentation)

Mets la conclusion (les quelques lignes finales) dans un paragraphe avec titre et mets le avant les sources

Je n'ai pas encore regardé le fond

+0 -0

Pour les citations, choisis les chevrons doubles ou l'italique, mais pas les 2

C'est noté.

Tes nombres dans le texte sont en latex ? C'est moche, la police n'est pas de la même taille. Limite l'utilisation du Latex aux formules.

Et dire que j'avais passé une plombe à mettre les nombres entre \$\$ dans le texte parce que je trouvais ça plus joli…

C'est toi qui a donner cette taille au Latex ou c'est par défaut dans ZdS ? Il faudrait diminuer la taille (idéalement, les formules inline devrait avoir la même taille que le texte). Aérer un peu les formules (interline plus grand ?) Et je suis pas fan des formules inline en général, cela alourdie la lecture.

Taille par défaut, je n'ai touché à rien au LaTeX. Je me suis contenté d'utiliser $\$\$$

Pour le code, limite la largeur (pour que cela reste dans l'écran sans devoir scroller). Donner le code ne sert à rien (tu donnes des explications sur la méthode, c'est le sujet de l'article. Mais mettre le code comme ça, sans explication, bof. Un lien vers github est suffisant. Si tu veux mettre le code, il vaudrait mieux écrire une partie "comment implémenter" et analyser les problématiques liées à l'implémentation)

Pas faux.

Mets la conclusion (les quelques lignes finales) dans un paragraphe avec titre et mets le avant les sources

C'est justement le principe des tutos sur ZdS : tu as l'intro, le corps et la conclusion. Donc je rajouterais un chapitre conclusion avant les sources ce qui impliquerait un nouvel extrait juste pour la conclusion et laisser l'espace réservé à la conclusion vide ? Ça ne me semble pas vraiment idéal :/

Je n'ai pas encore regardé le fond

Merci tout de même d'avoir déjà regardé la forme !

+0 -0

Bonsoir à tous,

j'ai apporté des modifications au tutoriel :

  • je l'ai clarifié pour des débutants au niveau des explications ;
  • j'ai clarifié la forme en minimisant les formules inline ($\$\$$) et en maximisant les formules $$\$\$\$\$$$
  • j'ai enlevé la mise en italique dans les citations ;
  • j'ai remplacé les nombres en LaTeX par des nombres en gras pour qu'ils ressortent toujours sans décaler tout le texte ;
  • j'ai reformaté les formules qui dépassaient de l'écran (c'est un peu un hack à coups de \\ et de \begin{aligned}/\end{aligned}).

Ce qui me reste à faire :

  • changer les illustrations selon les caractéristiques d'Aabu ;
  • regarder comment adapter la conclusion pour qu'elle apparaisse avant les sources.

Vos remarques sont toujours les bienvenues !

+0 -0

Bonjour,

La beta du tutoriel a été mise à jour.

Merci pour vos relectures

EDIT : Voilà, comme le dit le message automatique, j'ai fait des mises à jours :

  • quelques corrections mineures à gauche à droite ;
  • j'ai changé les images (merci beaucoup pour Aabu pour m'avoir fait découvrir Dia qui est très simple d'utilisation !), est-ce que l'image du graphe d'entropie est mieux ? Si non, qu'est-ce qu'il faudrait changer précisément ?
  • J'ai simplement interverti la conclusion et le chapitre de sources et liens. Est-ce que tu trouves ça mieux @gbdivers ?

Encore merci à vous pour me soutenir et pour m'apporter matière à travailler, je vous en suis très reconnaissant !

+0 -0

Bonjour, !

La beta du tutoriel a été mise à jour.

Merci pour vos relectures

EDIT :

encore changé la version de la bêta vu que j'ai apporté un changement de présentation de mes formules (qui étaient plutôt récalcitrantes !). J'aimerais avoir votre avis dessus : voir si c'est lisible ou s'il faut que je m'arrache les quelques pauvres cheveux qui me restent pour ça. ;)

+0 -0

Bonjour, !

La beta du tutoriel a été mise à jour.

Merci pour vos relectures

EDIT :

J'ai apporté les modifications suivantes :

  • j'ai approfondi les améliorations du chapitre 2.4 ;
  • j'ai fait des corrections mineures dans le texte ;
  • j'ai fait tout un nouveau point sur l'implémentation d'ID3 en Python3 de manière suivie et progressive.
+0 -0

Vais relire tout ça :)

Edit: remarque rapide: dans le point 5. Implémentation, évite d'utiliser des blocs spéciaux à la suite. Tu peux regrouper les deux premiers et le bloc question est de trop AMHA.

+0 -0

Merci Arius :)

Je pense que si je n'ai pas de remarques et/ou de propositions d'ici la fin du week-end, je le passerai en validation (oui oui… Un de plus !).

+0 -0

Bonjour, !

La beta du tutoriel a été mise à jour.

Bon voilà encore des modifications de formulation et d'orthographe/grammaire et j'ai commencé le code Python de l'algo C4.5 (qui forcément est un peu plus compliqué à mettre en œuvre de manière claire). Je pense proposer la validation une fois ce code terminé.

+0 -0
Ce sujet est verrouillé.