Bonjour,
Une petite questions pour les matheux.
J’ai une variable aléatoire X continue (une longueur par exemple). Je veux connaître certaines propriétés de la distribution de X à partir d’un échantillon, notamment l’asymétrie et le kurtosis, soit les moments d’ordre 3 et 4.
L’échantillonnage est discret (y1 % des données dans [a0;a1], y2 % dans [a1;a2], etc). Donc j’imagine qu’il s’agit d’utiliser des moments pondérés ?
Et dernière subtilité : les différents intervalles ne sont pas constant (ai+1−ai change selon i}.
Pour le moment j’ai fait un programme sous R avec la bibliothèque Weighted.Desc.Stat
qui contient les fonction w.skewness
et w.kurtosis
. J’ai pas trouvé d’équivalent sous Python. Ça me sort « un » résultat. Mais je ne suis pas sûr que ce soit aussi simple que ça.
Est-ce qu’il ne faut pas tenir compte des différences de tailles des intervalles par exemple ? Est-ce qu’il n’y a pas une petite subtilité liée au fait que les données sont entre deux valeurs, alors que dans le dataframe, elles sont soit alignées avec la borne inférieure, soit avec la borne supérieure ?
Et si oui, comment ?
Edit (question supplémentaire) : Et en cherchant à calculer le kurtosis manuellement, il s’avère qu’il s’agit du kurtosis centré, d’après wikipédia. Ne faudrait-il pas utiliser l’estimateur non biaisé ?