Regression linéaire, peut-on faire plus ?

Le problème exposé dans ce sujet a été résolu.

Bonjour aux mathématiciens, qui sont surement assez nombreux pour m'aider :D

Voilà j'ai repris mes cours, et on nous demande de faire des courbes, papier millimétré, crayon, règle, échelle correcte, etc… Cela ne me dérange pas. Mais j'ai pour habitude de régler les inconnues en faisans une interpolation linéaire :

X

Y

x1

y1

x2

y2

x3

y3

$$ y_2 = y_1 + \frac{(y_3 - y_1)(x_2 - x_1)}{(x_3 - x_1)}$$

Mais je ne sais pas faire ce genre de chose pour plus de point, en imaginons que ce qu'on analyse est une droite, et que l'on est 2 point autour de celui à trouver (nous aurions x0 / y0 et x4 / y4 ) comment les intégrer à la formule ?

Bien sur si c'est une courbe plus complexe je sais que cela n'est pas applicable. Mais j'aimerais juste trouver une formule qui me précise plus de chose. Comparé à un tracé hasardeux et chronophage ? :)

Merci pour la lecture de ce post !

LA SOLUTION :

Pour une équation de type Y = $\beta_1$X + $\beta_0$

$$ \beta_1 = \frac{(x_0 + x_1 + x_3 + x_4)(y_0 + y_1 + y_3 + y_4)-4(x_0y_0 + x_1y_1 + x_3y_3 + x_4y_4)}{(x_0 + x_1 + x_3 + x_4)² - 4(x_0² + x_1² + x_3² + x_4²)}$$

$$ \beta_0 = \frac{(y_0 + y_1 + y_3 + y_4)-\beta_1(x_0 + x_1 + x_3 + x_4)}{4}$$

+0 -0

Je n'arrive pas très bien à comprendre ce que signifie les équations montrées par Wikipédia avec les sommes et produits. Pourriez vous me faire un exemple avec les notations que j'ai employés dans mon tableau ?

Rappel :

X

Y

x0

y0

x1

y1

x2

y2

x3

y3

x4

y4

+0 -0

De ce que j'ai compris du problème - utiliser tous les points à ta disposition quand il y en a plus de 2 pour trouver un autre, je t'enverrais personnellement sur un modèle de régression linéaire qui incorporerait tous les points connus et te donnerait les valeurs notées $\beta_0$ et $\beta_1$ sur la page wiki de $Y = \beta_1 X + \beta_0$.

En revanche ça ne marche que si tu as affaire à une droite, si j'ai bien compris le problème c'est ce que tu cherches ; sinon c'est pas ça.

+1 -0

Goeland-croquant : tu es dans le vrai, c'est ce que je recherche. Parce que je sais bien trouver le coefficient directeur et faire la moyenne des 1000 coefficients directeur expérimentaux. Mais quand il y a un $ \beta_0 $ j'ne saurais faire.

Alors je tente avec mon exemple ?

$$ \beta_1 = \frac{(x_0 + x_1 + x_3 + x_4)(y_0 + y_1 + y_3 + y_4)-4(x_0y_0 + x_1y_1 + x_3y_3 + x_4y_4)}{(x_0 + x_1 + x_3 + x_4)² - 4(x_0² + x_1² + x_3² + x_4²)}$$

$$ \beta_0 = \frac{(y_0 + y_1 + y_3 + y_4)-\beta_1(x_0 + x_1 + x_3 + x_4)}{4}$$

C'est ça ? Et après j'calcul mon équation à un seul inconnu à l'aide de x2 ?

+0 -0

Les formules donnant les coefficients sont données sur la page Wiki, avec leur démonstration. En gros l'idée c'est de trouver les valeurs qui minimisent les distances entre le modèle linéaire $Y = \beta_1 X + \beta_0$ et les valeurs observées.

Bon le plus simple ça reste de passer par la calculatrice ; la façon de faire dépend évidemment des caltos mais tu dois bien avoir un mode d'emploi, dans la catégorie régression linéaire, qui t'explique où ranger les jeux de données et les commandes à faire pour obtenir directement leurs valeurs. Après tu sais faire, ranger les points connus, reprendre les valeurs des coefficients et calculer la donnée manquante.

Parce que je sais bien trouver le coefficient directeur et faire la moyenne des 1000 coefficients directeur expérimentaux.

C'est pas forcément la meilleure façon de faire justement, en les prenant un par un et faire la moyenne tu as un plus gros biais qu'en les prenant tous simultanément. La régression linéaire prend tout le monde en compte simultanément.

Edit pour répondre au tien : oui, ça a l'air d'être ça. J'ai eu un doute parce que je suis pas habitué à voir la formule écrite comme cela mais finalement je suis retombé sur mes pattes et ça m'a l'air juste.

+0 -0

Pas de calculette High-tech dans mon diplome. Donc pas de mémoire à disposition.

Oh c'est franchement ennuyeux ça, pour pas dire chiant. C'est pas des calculs durs mais ils sont pénibles. Après ça dépend de ce que tu appelles high-tech, une calculatrice de collège type TI-82 le fait très bien aussi. Mais si même elle est interdite, dans un cadre plutôt scolaire, ça m'étonnerait que tu en aies besoin, finalement. Peut-être qu'on attendra juste un simple calcul de coeff directeur avec deux points ou une simple méthode graphique, alors ?

+0 -0

Heu je comprend pas bien tu veux faire quoi exactement ?

C'est pour un examen ? Tu dois estimer une valeur en un point ? J'imagine que si c'est quelque chose de requis pour tes études il vous est enseigné comment procédé non ? Tu peux donner un exemple précis ?

Âpres la régression linéaire ou l'interpolation c'est plutôt difficile a gérer sans ordi (ou outils programmable), ça peux se faire pour 3, 4 point mais après ça devient particulièrement lourd !

Si c'est pour répondre à une question final d'examen, qui attende typiquement des réponses qualitative, la régression linéaire sur 2 point que tu propose dans ton premier post est normalement largement suffisante pour estimer une valeur en un point donné (modulo tous les conditions nécessaire pour un bon échantillonnage ).

L'autre methode, si tu connais la formule théorique qui est sensé passer par tes points et que tu as autant de coefficient indéterminé dans ta formule que de point tu peux essayer de résoudre un système d’équation pour avoir les valeurs des coefficients dans ton modèle.

Typiquement on te demande quel est la transmission au rayon X d'une plaque de 2mm de "tel materiaux" sachant que l'on a mesuré pour une même source de rayon X une intensité transmise de 2cd pour une plaque de 1mm et une intensité transmise de 1cd pour une plaque de 3mm. Tu sais que tu dois utiliser la loi de Beer-Lambert dans ce cas. Tu as donc juste à déterminer Io et alpha (cf wiki) et ensuite déterminer l’atténuation pour une plaque de 2mm.

Bref dans les autres cas (sauf examen de "méthode numérique" ou autre, où tu as explicitement appris des truc type "moindre carré", "interpolation" etc. ça me parait totalement improbable d'utiliser un truc plus compliqué que ce que tu propose dans le premier post.

PS : Je n'ai jamais rencontré ce que tu proposes dans ton dernier post, je sais pas d’où tu le sors mais je doute que ça aboutisse. La méthode classique de la régression linéaire est la méthode des moindres carré, ce dont il est question dans l'article de wiki sur la régression linéaire.

Bon et bien je vous donne un exemple alors. Car visiblement je n'emploie pas les bon termes (ce qui est fort possible au vue de mon piètre niveau en mathématiques). J'aimerais utiliser pour mes études une méthode un peu moins restrictives que ce que je présente dans mon premier post.

J'aimerais, sans avoir affaire à des calculettes sophistiquées (graphes, mémoire, données, programmes), utiliser une méthode posée comparable à la méthode graphique pour trouver un point.

Exemple : On a un tableau de 4 valeurs :

X

Y

10

24.9

20

46

25

59

30

65.1

100

205

J'aimerais pouvoir trouver, à l'aide d'une formule combien vaudrait Y pour X=35. Une formule que prendrait en compte chacun des chiffres inscrits dans ce tableau. :)

Si quelqu'un pouvait me montrer une équation me disant pour X=35 => Y=75 ce serait parfait :)

+0 -0

ok.

Maintenant pourquoi ne veux tu pas utiliser d'outils programmable ? C'est stupide (pour être parfaitement honnête ^^ ).

Bon c'est pas vraiment un exemple ton truc : il manque le contexte, sans contexte on peut pas te donner la méthode ! Ça dépend de ce que représente tes données ! Connais-tu le modèle théorique qu'elles doivent suivre ? ( par exemple : ça n'a aucun sens de vouloir faire passer une droite dans des données qui suivent une exponentielle).

Si tes données correspondent à une droite alors une régression linéaire classique est suffisante (t'as de la chance c'est le plus simple … mais ça reste chiant). Si tu veux une droite d’équation ax+b, les coefficient a et b sont donné par :http://serge.mehl.free.fr/anx/meth_carr.html (cf la fin de la page avant les exercices )

PS : je trouve très étrange qu'on vous demande de faire ce genre de chose sans ordi.

+1 -0

Ils ne nous demandent pas de faire de régression linéaire, ils nous demandent de faire par le ture graphique. Je cherche, pour élargir mes possibilité, une méthode calculatoire.

Mais on a le droit qu'à de simples outils : +-/x ln log10 puissance/racine

Merci, je check ca

+0 -0

Ok du coup par lecture graphique, tu prends une valeur "à l'arrache", à l’œil en 5 secondes (ou avec la méthode du premier post, mais dans ce cas il faut utiliser les points extremums pour limiter l'erreur) et ça sera bien plus efficace que s’embêter à déterminer la meilleur droite qui décrit tes points. Tu auras une valeur quasi aussi précise et tu n'auras pas perdu 5 mn à faire des sommes à la calculette. (avec potentiellement l'oubli d'un ou 2 termes )

Quand un énoncé dit lecture graphique on s'attend pas à ce que tu fasses une méthode compliqué, ce qui est attendu c'est une valeur "grossière".

Les méthodes type régression ou autre sont faites pour obtenir des erreurs et comparer ces erreurs aux erreurs statistique, pour voir si il y a des incohérences (trop de variations dans les données), si le modèle est bon etc. Ou pour estimer une valeur de manière précise

Connaitre par cœur le résultat des moindres carré n'a rien d'intéressant. Le seul truc intéressant c'est de savoir comment fonctionne les moindres carré (et de manière générale de toute les méthodes numériques) pour après choisir la méthode numérique optimum pour résoudre un problème (mais encore une fois c'est avec des ordi qu'on les utilises).

+0 -0

Je ne suis pas sur d'avoir bien compris le problème, mais peut-être que ce sont les polynômes interpolateurs de Lagrange qui t'intéresseraient.

Holosmos

Yep cherche 'interpolation' y a différente méthode, polynôme, cosinus et spline principalement.

Vael

Dans le titre du sujet, l'auteur veut faire une regression (aka, avoir un modele pour prevoir de futures valeurs) et non pas une interpolation (reconstruction de donnees manquantes). L'objectif etant different, les approches le sont aussi.

Typiquement, un modele obtenu par interpolation a un potentiel d'explication nul.

L'auteur cherche plutot un modele regressif exponentiel, tout simplement.

EDIT: Ceci dit, en relisant, l'OP ne semble pas tres clair sur ce qu'il cherche a faire. EDIT2: Donc pour clarifier, Blackline, souhaites-tu faire passer une courbe par tous les points d'un ensemble de points donnes ou souhaites-tu etablir un modele, avec probablement pour but de predire d'autres points ?

+0 -0

Attention : ce message a été écrit avant un prise de conscience importante

Oui Höd je souhaite prédire des points d'une droite :) C'est ça.

Pour préciser, et maintenant je le comprend ce que j'ai écris dans le premier post ce n'est pas une regression linéaire mais c'est comme ça qu'on m'a dit que ça s'appellait en Terminale. Donc désolé pour la terminologie du post qui est donc fausse.

Reformulation

J'aimerais savoir comment on fait pour trouver les points d'un droite sans passer par la lecture graphique ? Sachant que la droite en question peut passer par être affine ou non.

J'aimerais bien comprend comment marche "méthode du moindre carré" ou la "régression linéaire" (je n'ai pas bien comprit la différence, il y en a un qui permet de faire une droite à partir d'une courbe ? Et de déterminer les points justes ?).

J'ai regardé les équations sur Wikipédia, et j'suis pas trop un pro de la lecture des équations. J'ai essayé plus haut de vous demandez si ce que j'écrivais était logique m'enfin.

Du coups j'aimerais beaucoup qu'on me donne un exemple d'équation sur un tableau comme celui-ci par exemple :

$X$

$Y$

$X_1$

$Y_1$

$X_2$

$Y_2$

$X_3$

$Y_3$

Si Y2 est la valeur que l'on cherche ? :)

Merci encore pour votre patience

Roh putain le Segpa que je suis. Je n'avais jamais vu l'EDIT de goeland croquant ! J'viens de tester, effectivement la formule écrite plus haut fonctionne très bien ! Merci A tous !

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte