python regression de lasso prédire un accident ?

a marqué ce sujet comme résolu.

Bonjour, j’ai un fichier csv contenant des données : la date, la température en degré celcius et une collonne accident 0 non, 1 oui je cherche a faire avec la régression de lasso de la prédiction d’accident, avec en plus la prise en charge d’un profil saisonnier car en été il fait plus chaud que en hiver

j’ai bien trouvé des exemples mais aucun avec de la prédiction dans le temps, aussi je me pose la question, peut on faire de la prédiction ou bien lasso ne permet que de détecter des anomalies sur des données que l’on possède déjà ?

Je ne connaissais pas la régression de Lasso. Et donc j’ai regardé Wikipédia. Et Wikipedia dit : le lasso fonctionne dans les cas où le nombre d’individus est inférieur au nombre de variables (n<p) , si toutefois un faible nombre de ces variables a une influence sur les observations.

Ici tu as n individus (n=1000 ?). Et tu as 2 variables (date + température). On n’est donc pas du tout dans une configuration ou le Lasso serait adapté.

Je pense qu’il faut que tu donnes plus d’éléments.

Le lasso est simplement une technique de régularisation qui te permet d’éviter l’over fitting. En pratique ça évite que tes coefs de regression soient trop grands et qu’ils ne collent trop à tes données.

C’est fait justement pour faire de la prédiction, même si tu peux aussi l’utiliser pour détecter les données anormales.

Cela dit, comme le rappel mon vdd, je doute que tu as besoin de régularisation dans ton cas… Commence par visualiser tes données et tenter une régression linéaire classique une fois que tu aura enlever la saisonnalité.

+0 -0

désolé de pas avoir répondu plus tot, j’ai fais pas mal de recherche cette semaine lié aux algo de régressions.

je réexplique mon probleme, j’ai des données sur la défaillance de capteurs d’avion, et j’en recois en temps réel et je voudrais essayer de prédire la défaillance avec la régression linéaire (ou lasso)

j’ai une colonne date, une colonne panne, 0=marche bien, en panne =1 et le reste c’est de la télémétrie, températeure, humidité, altitude, pression…etc.

je cherche en python une implémentation d’une régression linéaire en temps réel afin de prédire quand si demain j’aurais la panne…ou pas aujourd’hui j’arrive a le faire sans le temps réel, mais j’aimerais pouvoir mettre a jour mon modele temps réel, mais je ne sais pas comment faire.

la télémétrie est saisoniere dans un sens, car certain capteurs tombe en panne plus en hiver et d’autre plutôt en été.

aujourd’hui ce qui me manque c’est le temps réel

et je me pose une question comment faire la prédiction sans avoir toute les données ? voici un exemple simple avec la lib sklearn :

from sklearn.linear_model import LinearRegression
from sklearn.datasets import make_regression
#dataset
#X : Date en milliseconde; temperature en degrée celsius; humidité en %
#y : 0= aucun probleme; 1 = le capteur est tombé en panne
X=[[969695100000,15,10],[969788280000,30,50],[975042120000,20,3]]
y=[0,1,0]
model = LinearRegression()
model.fit(X, y)


# Prediction
Xnew, _ = make_regression(n_samples=3, n_features=3, noise=0.1, random_state=1)
ynew = model.predict(Xnew)
for i in range(len(Xnew)):
    print("X=%s, Prediction=%s" % (Xnew[i], ynew[i]))

pour pouvoir prédire ce qu’il vas arriver demain par exemple, je suis obliger de renseigner toute les valeurs de X, existe t’il ujne implémentation ou j’aurais que a renseigner la date dans les X ? ou bien sklearn a t’il une fonction pour estimer la température et l’humidité de demain et de prédire la valeur y ?

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte