Questions de Statistiques

Le problème exposé dans ce sujet a été résolu.

Bonjour à tous,

Je réalise mon mémoire en Biologie et j’ai des questions de Statistiques de base.

1) J’ai un nuage de points, comment savoir quel modèle utiliser faire un "fit" ? Sur Excel, ils me proposent que des régressions linéaires si je ne me trompe pas (? ça serait étonnant).

2) Est-ce qu’Excel utilise d’office les moindres carrés si c’est une régression linéaire ?

3) Est-il possible de calculer un intervalle de confiance sur le R2 ? Si oui, comment faire ?

Merci d’avance, Soti

Salut,

1) J’ai un nuage de points, comment savoir quel modèle utiliser faire un "fit" ? Sur Excel, ils me proposent que des régressions linéaires si je ne me trompe pas (? ça serait étonnant).

Tu es censé utiliser un modèle qui correspond à la réalité. :D Intuitivement, faire une régression, c’est trouver les meilleurs paramètres pour un modèle donné, mais c’est aussi estimer à quel point un modèle donné prédit les données. En fonction de tes besoins, trouver un modèle quelconque qui marche bien peut être suffisant (un modèle empirique sans fondements théoriques par exemple). Mais souvent tu vas avoir envie d’un modèle qui correspond à une théorie derrière.

Excel propose différents types de régression (linéaire, lois de puissance, logarithmique) avec différentes options pour chaque.

2) Est-ce qu’Excel utilise d’office les moindres carrés si c’est une régression linéaire ?

Après une recherche rapide, il semblerait que oui. Je ne sais pas si la doc d’Excel donne des détails sur l’algo.

3) Est-il possible de calculer un intervalle de confiance sur le R2 ? Si oui, comment faire ?

Je ne suis pas statisticien, mais je crois que calculer un intervalle de confiance sur R2 n' pas beaucoup de sens, parce que ce chiffre t’indique déjà à quel point tes données correspondent à la droite de régression. C’est une mesure de à quel point les données diffèrent de la droite de régression.


Ceci dit, en fonction du besoin derrière tes questions, il y a peut être d’autres outils statistiques qui seraient plus adaptés à ton problème.

Tu es censé utiliser un modèle qui correspond à la réalité. :D

Dans l’idéal, oui, mais j’apporterai un petit bémol. Parfois, on veut juste une fonction qui fit, pour avoir une loi phénoménologique. Sauf que si tes points sont si dispersés que tu vois pas à l’œil quel modèle utiliser, ta loi phénoménologique perd encore en intérêt.

+2 -0

Tu es censé utiliser un modèle qui correspond à la réalité. :D

Dans l’idéal, oui, mais j’apporterai un petit bémol. Parfois, on veut juste une fonction qui fit, pour avoir une loi phénoménologique. Sauf que si tes points sont si dispersés que tu vois pas à l’œil quel modèle utiliser, ta loi phénoménologique perd encore en intérêt.

Gabbro

Oui, tout à fait. Je n’ai pas choisi les bons mots, mais c’est ce que je voulais dire par « un modèle empirique sans fondements théoriques ».


@sotibio dans le cas où tu ne connais pas la vraie loi derrière tes points, le modèle le plus simple sera en général le meilleur. La régression linéaire est la plus simple, parce que tous les modèles compliqués ressemblent localement à des droites (les tangentes à la courbe). Une fonction linéaire (ou affine) est aussi dans une certaine mesure la fonction mathématique la plus simple qui n’est pas constante.

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte