Afficher compréhensiblement des données

En python 3 avec des dataframes Pandas

a marqué ce sujet comme résolu.

Bonjour les zestonautes !

Dans le cadre d’un stage je récupère des données des compteurs de performances des processeurs (avec le bon vieux PAPI) et je dois les interpréter pour repérer des changements significatifs.

Jusqu’ici j’ai réussi à obtenir et récupérer dans un dataframe Pandas mes données et les ai triées en deux catégories, mon dataframe ressemble peu ou prou à ça :

Index Compteur 1 Compteur 2 ~ 10 compteurs de plus Catégorie
0 123400 1237630000 Seul
1 123445 1596630000 Multi

J’aimerais l’afficher avec des graphiques pour pouvoir visualiser les caractéristiques de mes deux catégories comme :

  • Les minimas / maximas de chaque compteur selon la catégorie
  • Les moyennes
  • A quel point mes deux catégories différent

Pour ça j’avais pensé à faire des boites à moustaches (au lycée on en faisait et ça me paraissait pas trop mal), mais je ne sais plus vraiment comment les interpréter…

Du coup j’ai voulu faire un histogramme, mais le résultat de dataframe.plot.hist() n’est pas très lisible je trouve, j’ai essayé de faire avec dataframe.plot.hist(subplots=True), c’est légérement mieux car mes colonnes ont de gros écarts, mais ça ne permet pas une bonne interprétation.

Est ce que vous auriez des pistes pour avoir un affichage comme je cherche des données ? Ou bien est ce qu’il faudrait que j’applique un traitement sur mes données avant (pour le moment je les groupe seulement selon la catégorie via dataframe.groupby("Catégorie") ) ?

Merci d’avance !

PS : Pour la catégorie Science dans forums, je me suis dit que c’était plus adapté car ce que je cherche c’est comment bien visualiser ces données, si vous considérez que c’est plutôt spécifique à python / pandas, alors mieux vaut déplacer le sujet là bas.

PPS : On ne peut plus visualiser tout les smileys avec le nouvel éditeur ? Je n’ai pas trouvé le bouton et je ne me souviens plus des codes :(

+0 -0

Tu peux les afficher en courbes aussi, si tu veux avoir un aperçu.

Les boîtes à moustache, c’est simple. En partant du centre, tu as un trait qui indique la médiane, un côté de la boîte qui indique un quartile, puis le bout de la moustache qui indique la valeur minimale ou maximale. Parfois, tu as des points en-dehors qui sont des valeurs anormales.

P’tite page wiki si tu veux le voir avec l’image ;) https://fr.wikipedia.org/wiki/Bo%C3%AEte_%C3%A0_moustaches

+0 -0

Merci pour la documentation sur les boites à moustache, je n’avais pas pensé à aller chercher sur wiki tout simplement, honte ! ^^'

Pour l’affichage en ligne, ça donne effectivement un petit apercu, mais ça laisse penser qu’il y a une temporalité alors que non.

J’ai fait l’affichage des boites à moustache avec pandas du coup, le résultat est plutôt bien moche ma foi :

Il faut que je retravaille un peu mes subplots je pense, par contre il y’a beaucoup de points anormaux dans les données du coup.

+0 -0

Bonjour, un élément qui rend ces graphes difficiles à interpréter est le fait qu’ils ont chacun leur propre échelle, par exemple comparer le 1er qui va de 2500 à 7000 avec le 4ème qui va 0 à 2.

Si tous les graphiques sont réellement comparables peut être qu’une échelle log avec des min/max identiques pour tous aiderait à la lisibilité, ou faire plusieurs graphiques regroupant ceux qui sont comparable.

Au vu des données brutes que j’ai, tout les graphiques ne sont pas comparables, ce que je voulais c’est comparer leurs valeurs entre mes deux catégories (Seul vs Multi).

Est ce qu’il faudrait mieux que je regroupe les graphiques sous la forme : Boites à moustache de colonneX selon la catégorie cote à cote ?

Parce que pour le moment j’ai essayé en mettant les graphiques en ligne à coté, pour chaque colonne et chaque catégorie, on voit des différences mais pas si bien que ça.

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte