assymétrie et kurtosis pondéres de données discrétisées

a marqué ce sujet comme résolu.

Bonjour,

Une petite questions pour les matheux.

J’ai une variable aléatoire XX continue (une longueur par exemple). Je veux connaître certaines propriétés de la distribution de XX à partir d’un échantillon, notamment l’asymétrie et le kurtosis, soit les moments d’ordre 3 et 4.

L’échantillonnage est discret (y1y_1 % des données dans [a0;a1][a_0; a_1], y2y_2% % dans [a1;a2][a_1; a_2], etc). Donc j’imagine qu’il s’agit d’utiliser des moments pondérés ?

Et dernière subtilité : les différents intervalles ne sont pas constant (ai+1aia_{i+1} - a_i change selon ii}.

Pour le moment j’ai fait un programme sous R avec la bibliothèque Weighted.Desc.Stat qui contient les fonction w.skewness et w.kurtosis. J’ai pas trouvé d’équivalent sous Python. Ça me sort « un » résultat. Mais je ne suis pas sûr que ce soit aussi simple que ça.

Est-ce qu’il ne faut pas tenir compte des différences de tailles des intervalles par exemple ? Est-ce qu’il n’y a pas une petite subtilité liée au fait que les données sont entre deux valeurs, alors que dans le dataframe, elles sont soit alignées avec la borne inférieure, soit avec la borne supérieure ?

Et si oui, comment ?

Edit (question supplémentaire) : Et en cherchant à calculer le kurtosis manuellement, il s’avère qu’il s’agit du kurtosis centré, d’après wikipédia. Ne faudrait-il pas utiliser l’estimateur non biaisé ?

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte