Bonjour,
Je suis actuellement bloqué sur un problème de probabilité (il me semble) nécessitant de calculer la moyenne de la plus grande valeur d'une population aléatoire. Pour expliquer plus clairement, supposons que je sois un scientifique si s'intéresse à la taille des êtres humains et plus particulièrement, je souhaiterais estimer (grace aux probabilités) la taille du plus grand être humain vivant. Je peux faire des mesures sur des échantillons de la population mondiale, mais je ne peux, évidemment, pas demander la taille de tous les êtres humains.
Alors, pour l'instant, j'ai fais la supposition que ma population suit une loi normale. Vu la manière dont je génère mes échantillons, la moyenne est déjà connu (et les mesures correspondent). Par contre, j'ai rencontré un premier problème pour l'écart-type : même avec un million d'éléments, l'écart-type mesuré à une variation de 3-4%, ce qui me semble beaucoup. Au passage, c'est $\frac{1}{n}$ ou $\frac{1}{n-1}$ qu'il faut utiliser pour estimer la variance?
Ensuite, il faudrait que je vérifie que ma population corresponde bien à la loi normale estimée. Il me semble qu'il y a des méthodes pour ça, mais je n'arrive pas à les retrouver. Après, cette étape n'est pas forcément trop importante dans mon cas puisque, vu la manière dont je génère mes échantillons, ça me semble assez logique d'avoir une loi normale.
Enfin, une fois que l'on a les paramètres, il faut calculer l'espérance du maximum de n tirages. Vu que mon n est très grand (de l'ordre de 10^90), il m'est totalement impossible d'avoir une idée de l'espérance juste en essayant de faire plein de tirages. Donc je suis obligé de passer par les math.
Ici, en notant $F_{max}(x)$ la fonction de répartition de l'espérance du maximum de n tirages, j'ai
Donc on a la fonction de répartition du maximum en fonction de la fonction de répartition d'un élément de la population. On veux donc calculer $E = \int_{-\infty}^{+\infty}xf_{max}(x)dx$, en sachant que $F_{max}(x) = \int_{-\infty}^{x}f_{max}(t) dt$. Et là, je commence à sérieusement sécher pour arriver à me dépatouiller. Au passage, je n'ai pas besoin d'une formule exacte (s'il en existe une), un résultat numérique me suffit.
Enfin, j'aimerais arriver à avoir un interval de confiance pour ce résultat (en partant de celui de la variance). Pour le coup, c'est un terrain totalement inconnu pour moi. Donc si c'est trop compliqué, je vais peut-être le laisser de côté.
Est-ce qu'une âme charitable a une idée?
Merci d'avance.