Statistique, définition moyenne empirique

a marqué ce sujet comme résolu.

Bonjour,

Une petit question très théorique :

Soit un échantillon de taille nn, soient x1,x2,,xnx_1, x_2, … , x_n les valeurs observées, et X1,X2,,XnX_1, X_2, … , X_n les variables aléatoires associées.

Tous les bouquin de statistiques définisse la moyenne empirique comme étant :

Xˉ=1ni=1nXi\bar{X} = \frac{1}{n} \sum^n_{i=1}{X_i}

Or lorsque l’on fait le calcul, c’est toujours

xˉ=1ni=1nxi\bar{x} = \frac{1}{n} \sum^n_{i=1}{x_i}

qu’on utilise. Le premier n’est pas calculable (sinon pourquoi faire une estimation par échantillonnage ?), non ?

J’ai donc forcément une confusion dans ma compréhension de la notation utilisée, mais je n’arrive pas à comprendre pourquoi.

La premiere expression est la moyenne d’une suite de variable aléatoire. Le resultat est une variable aleatoire. C’est un estimateur de E[X]E[X].

La seconde expression est la moyenne empirique d’un echantillon observé.

Imagine X1X_1 et X2X_2 de loi uniforme, respectivement sur [0,1] et [2,3].

La moyenne empirique de Y=X1+X2Y = X_1 + X_2 est 12(X1+X2)\frac 1 2(X_1 + X_2). A ce stade, tu ne peux rien faire de plus pour avoir un resultat concret.

Maintenant, on te donne un certain nombre d’observations e.g. (0.1, 2.1). Dans ce cas precis, j’ai construit l’exemple de sorte a ce que l’on puisse connaitre de quelle variable aleatoire chaque observation provient (resp X1X_1 et X2X_2). Ton estimation de Xˉ\bar X est donc donnee par xˉ=12(0.1+2.1)\bar x = \frac 1 2 (0.1 + 2.1)

Mais en pratique il se peut parfaitement que tu observes plus d’observations que de variables aleatoires. Imagine par example que X1X_1 et X2X_2 soient des variables aleatoires representant la mesure de temperature des stations meteorologique dans une ville donnee. A ce moment, les xix_i seront toutes les mesures observees de tes deux stations.

Souvent en pratique on a une seule variable aleatoire et l’on suppose que les observations sont i.i.d et suivent cette variable aleatoire sous-jacente. Mais en realite l’estimateur fonctionne meme si chaque observation provient de variables aleatoires avec des lois differentes et non independentes.

+2 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte