Bonjour,
Le titre n’est pas forcément tip-top, voici un résumé de mon problème vite-fait :
J’ai un système bruité, je veux étudier les conséquences d’un changement de paramètre d’entrée. Quand puis-je dire proprement que c’est statistiquement significatif sachant que je travaille dans un contexte ne me permettant pas de nombreuses mesures ?
Je fais des simulations plutôt longues. À partir de paramètres d’entrée, notons les $A$, j’obtiens un résultat chiffré, $R(A)$. Ou, pour être plus précis $R(A)_1$, car j’ai une certaine volatilité d’une fois sur l’autre. Je peux typiquement faire une simulation 3 fois (autant dire que le faire 10 fois pour avoir de vrais stat n’est pas possible), donc $R(A)_1$, $R(A)_2$ et $R(A)_3$. J’en déduis une moyenne $E(R(A))$ et un écart-type $\sigma(R(A))$ (typiquement, $\sigma$ vaut un dixième de $E$).
Maintenant, je vais changer l’un des paramètres d’entrée, le but étant d’étudier son influence toutes choses égales par ailleurs1. J’ai donc des paramètres d’entrée $B$, et $R(B)_1$, $R(B)_2$ et $R(B)_3$ d’où je déduis $E(R(B))$ et $\sigma(R(B))$2.
J’aurais un grand nombre de test, je n’aurai pas de problème conceptuel à dire que l’effet est $E(R(B)) - E(R(A))$ quel que soient les $\sigma$, mais là, j’ai typiquement trois essais. Je me demande donc : comment puis-je savoir si les différences constatées sont statistiquement significatives ou non sans avoir à faire plein de tests ? Cela me rappelle furieusement les estimateurs de vraisemblance et ce genre de choses, mais je serai bien en peine de faire ça correctement.
Dis autrement, il y a la vraie moyenne, celle que j’ai calculé, et je souhaiterais savoir si la différence $E(R(B)) - E(R(A))$ est explicable seulement par mon imprécision sur la moyenne calculée ou si cela dénote un véritable effet sous-jacent. J’espère pourvoir estimer la différence entre la vraie moyenne et celle calculée à l’aide de $\sigma$, mais je ne sais pas trop comment faire ça proprement.
Si vous avez des commentaires, papiers, cours ou que sais-je à me proposer, ce serait avec joie. Merci beaucoup.
-
Parfois, ce n’est pas aussi simple, mais oublions ce détail pour se focaliser sur la partie statistique. ↩
-
Notez que dans mon domaine, on trouve rarement l’écart-type dans les papiers. On m’a très sérieusement répondu qu’ils préféraient simuler des systèmes plus gros (qui devraient être plus précis) que plusieurs plus petits qui leur donneraient une estimation de l’imprécision / la non-répétabilité. Donc vis-à-vis des standards du domaine, je me prends la tête pour rien… ↩