Calcul / Prévisionnel / Date [débutant]

asteqlik, lundi 29 juin 2015 à 15h08
Modifié par Coyote

Bonjour,

Voila, je dispose d'un certain nombre de donnée avec des dates (tout format possible 'DD/MM/YYYY hh:mm:ss'). A partir de ses dates j'aimerais savoir ce qu'il m'est possible de faire comme équation prévisionnel ?

Je pensais a des choses comme le taux d'évolution moyen par jours, taux d'évolution moyen par heures par jours…

Si vous avez un petit cours la dessus je suis preneur

Cordialement.

29/06/15 à 15h08
Modifié

+0 -0

Vayel, lundi 29 juin 2015 à 15h55

Tu veux dire que tu as un ensemble de dates et de valeurs associées (du genre une production) et que tu veux prévoir, à partir des valeurs passées, celles futures ?

Le cas échéant, il va falloir préciser deux-trois trucs :

Quel niveau as-tu en Maths ?
Quel est le problème exactement ?
Quel niveau de précision ?
Aurais-tu un échantillon des données (genre un graphe) ?

Dans le cas contraire, je n'ai pas compris la question.

Tchou !

29/06/15 à 15h55

"Bienheureux celui qui sait rire de lui-même, il n’a pas fini de s’amuser." Joseph Folliet

+2 -0

asteqlik, lundi 29 juin 2015 à 17h03
Modifié

Merci de votre réponse,

C'est tout a fait ça, a partir de mes données je dois prévoir la suite.

Mon niveau, et bien on va dire 0, mes dernier algo remonte a plusieurs années.. (Mais je suis assez rapide a la détente )
Le problème consiste en la création des équations.
Pour la précision, au plus précis ca marche ?

Voici un exemple de donnée que je peut avoir :

date valeur 29/06/2015 00:00 1600 29/06/2015 01:00 1200 29/06/2015 02:00 950 29/06/2015 03:00 800 29/06/2015 04:00 750 29/06/2015 05:00 780 29/06/2015 06:00 850 29/06/2015 07:00 1090 29/06/2015 08:00 1370 29/06/2015 09:00 1570 29/06/2015 10:00 1700 29/06/2015 11:00 1840 29/06/2015 12:00 1880 29/06/2015 13:00 1882 29/06/2015 14:00 1840 29/06/2015 15:00 1820 29/06/2015 16:00 1830 29/06/2015 17:00 1940 29/06/2015 18:00 2000 29/06/2015 19:00 2078 29/06/2015 20:00 2157 29/06/2015 21:00 2157 29/06/2015 22:00 2073 29/06/2015 23:00 1850 30/06/2015 00:00 1650 30/06/2015 01:00 1200 30/06/2015 02:00 970 30/06/2015 03:00 810 30/06/2015 04:00 755 30/06/2015 05:00 790

dateHour http://hpics.li/228e7de

J'aimerais prévoir la suite.

De même par jours, dans un autre graphique, - je calcul les moyennes par jours (sommes des valeurs / nombre d'heure) - je calcul l'évolution entre chaque jours (deuxiéme jours / premier jours) - et je fais la moyenne de ses taux d'évolution (somme des taux/ nombre de taux) Mais ca me parait pas tellement optimale..

[edit] désolé pour l'affichage des données ca donnée mieux dans l'éditeurs

29/06/15 à 17h03
Modifié

+1 -0

Vayel, lundi 29 juin 2015 à 18h33

Mon niveau, et bien on va dire 0, mes dernier algo remonte a plusieurs années.

Je ne parle pas d'info mais de maths. En quelle classe es-tu ?

Le problème consiste en la création des équations.

Ce n'est pas très explicite. Concrètement, que représentent ces valeurs ? Dans mon cas, dernièrement, c'était la production quotidienne d'une vache.

J'aimerais prévoir la suite.

Si j'ai bien compris, tu as une valeur par heure (hourly data en anglais, je retrouve plus le terme français).

En as-tu pour toutes les heures ou y a-t-il des trous ?
Sur combien d'heures as-tu des données ? Peux-tu créer un graphe les représentant toutes (à moins que ce soit déjà le cas de celui que tu m'as fourni) ?
Sur combien d'heures veux-tu prévoir ?

29/06/15 à 18h33

"Bienheureux celui qui sait rire de lui-même, il n’a pas fini de s’amuser." Joseph Folliet

+2 -0

asteqlik, mardi 30 juin 2015 à 09h20
Modifié

Je ne parle pas d'info mais de maths. En quelle classe es-tu ?

Mon dernier cours de math date des proba et state vue en bts sio..(je suis en lp Conception de Solutions Décisionnelles)

Ce n'est pas très explicite. Concrètement, que représentent ces valeurs ? Dans mon cas, dernièrement, c'était la production quotidienne d'une vache.

J'ai était lire le post mais c'est un peu compliqué pour moi :/ , moi ca représente un débit en Mbps en y et les dates en x. Donc a priori le même fonctionnement ?

Si j'ai bien compris, tu as une valeur par heure (hourly data en anglais, je retrouve plus le terme français).

Oui c'est bien cela.

En as-tu pour toutes les heures ou y a-t-il des trous ?

Partons du principe qu'il n'y en a pas (il y en mais je les évites avec une condition if() ).

Sur combien d'heures as-tu des données ? Peux-tu créer un graphe les représentant toutes (à moins que ce soit déjà le cas de celui que tu m'as fourni) ?

Hourly : http://www.hostingpics.net/viewer.php?id=223465heure.png

http://hpics.li/dce4cf4 (la courbe bleu c'est une courbe linéaire, ne pas s'en préoccupé)

Daily (moyenne par jours) : http://www.hostingpics.net/viewer.php?id=911893jours.png

Mes historiques peuvent varié de 3 semaines a plusieurs mois..

Sur combien d'heures veux-tu prévoir ?

Pour ca, a vous de me dire par rapport a la précision. en prenant par heures, peut étre une semaine, par contre en prenant par jours plutot sur 1 mois voir 2. Si c'est possible avec mes données biensur.

Encore merci de votre implication

30/06/15 à 09h20
Modifié

+0 -0

Kje, mardi 30 juin 2015 à 10h13

Tu connais quelques langages de prods ? Techniquement en Python j'utiliserais à ta place Pandas mais je ne sais pas si tu te sent d'aller sur ça.

30/06/15 à 10h13

+1 -0

asteqlik, mardi 30 juin 2015 à 10h43
Modifié

Bonjour Kje et merci de votre réponse

En faite, je suis sous qlikview, donc c'est vraiment les équations que je dois trouvé pour les appliquées (adaptées) a mes graphes.

30/06/15 à 10h43
Modifié

+0 -0

Vayel, mardi 30 juin 2015 à 14h40

Il faudrait que tu précises le contexte. Comment obtiens-tu ces mesures ? C'est un débit de quoi ? Connaître le phénomène physique aide grandement : dans le cas d'un vache par exmeple, il y a des facteurs biologiques permettant d'expliquer les données mesurées.

Je ne suis pas un expert en la matière, mais ARMA me semble intéressant. Mais si tu n'as pas de bases en probas, ça va être chaud. Quelques ressources :

Nuançons tout de même : R te permet de faire les calculs sans trop de peine, donc tu pourras toujours te débrouiller sans comprendre les aspects mathématiques, mais ça reste risqué.

Ton travail va se partager en deux :

Modéliser les données ;
Prévoir.

Il est nécessaire de construire le modèle à partir d'un ensemble de données et de tester la prévision sur un autre ensemble. Par exemple, j'ai construit mon modèle à partir des données "de gauche" (avant la semaine 175 à peu près), en excluant celles où la prévision (en rouge) commence :

30/06/15 à 14h40

"Bienheureux celui qui sait rire de lui-même, il n’a pas fini de s’amuser." Joseph Folliet

+1 -0

asteqlik, mardi 30 juin 2015 à 15h19

Pour le contexte j'ai simplement une sonde sur un réseau, elle me stock un débit(en Mbps) par heures. Il y a donc différents facteurs comme le week-end ou y a une hausse, de même la nuit.

A vrai dire je ne m'attendais pas a quelque chose d'aussi compliquée..

Je pensais calculé le taux d'évolution moyen de 00:00 les lundi, de 01:00 les lundi, … de 00:00 les mardis… prend les dernières valeurs et multiplié par ses taux, de même en journalier. J'étais loin de savoir dans quoi je m'embarqué

30/06/15 à 15h19

+0 -0

unidan, mardi 30 juin 2015 à 15h54

Ton taux d'évolution, c'est ça : https://fr.wikipedia.org/wiki/Taux_d%27%C3%A9volution ?

Parce qu'il est défini seulement sur deux dates données et ne dépend pas des dates entre, donc le taux d'évolution moyen c'est simplement cette quantitée que tu calcules entre chaque jour (par exemple) à heure fixée et dont tu fais la moyenne.

Tu cherches peut être plutot à obtenir la "dérivée" du signal correspondant ?

Ou prédire les futures évolutions du signal, connaitre les fréquences associées ?

30/06/15 à 15h54

+1 -0

asteqlik, mardi 30 juin 2015 à 16h50

Ton taux d'évolution, c'est ça : https://fr.wikipedia.org/wiki/Taux_d%27%C3%A9volution ?

taux d'arrivé / taux de départ

Parce qu'il est défini seulement sur deux dates données et ne dépend pas des dates entre, donc le taux d'évolution moyen c'est simplement cette quantitée que tu calcules entre chaque jour (par exemple) à heure fixée et dont tu fais la moyenne.

Je pensais le faire entre chaque heures, pour chaque taux entre 00:00 et 01:00 j'en calcul un taux moyen, pour chaque taux entre 01:00 et 02:00 j'en calcul un taux moyen, …

Tu cherches peut être plutot à obtenir la "dérivée" du signal correspondant ?

Ou prédire les futures évolutions du signal, connaitre les fréquences associées ?

Oui il me faut prédir les prochaines évolutions.

30/06/15 à 16h50

+0 -0

Vayel, mardi 30 juin 2015 à 16h55

Tu cherches peut être plutot à obtenir la "dérivée" du signal correspondant ?

Ou prédire les futures évolutions du signal, connaitre les fréquences associées ?

Oui il me faut prédir les prochaines évolutions.

Cette réponse me fait malheureusement penser que tu n'as pas le niveau mathématique pour.

30/06/15 à 16h55

"Bienheureux celui qui sait rire de lui-même, il n’a pas fini de s’amuser." Joseph Folliet

+1 -0

asteqlik, mardi 30 juin 2015 à 17h11
Modifié

Tu cherches peut être plutot à obtenir la "dérivée" du signal correspondant ?

Ou prédire les futures évolutions du signal, connaitre les fréquences associées ?

Oui il me faut prédir les prochaines évolutions.

Cette réponse me fait malheureusement penser que tu n'as pas le niveau mathématique pour.

Je confirme, je n'ai pas du tout ce niveau, mais je pensais qu'une méthode ou une fonction type permettrait à partir de mes x et y, de calculer un taux d'évolution moyen pour chaque heures et chaque jours, et qu'en bidouillant mon gros qlikview je pourrais l'adapter a mes graphs.

Si c'est hors de porté tant pis pour moi, tels est l'avenir d'un STG (STMG) (je vais me débrouillé autrement, ca sera juste moins précis)

Merci a vous pour votre temps

30/06/15 à 17h11
Modifié

+0 -0

Vayel, mardi 30 juin 2015 à 17h17

Ben après ça semble tout de même sacrément régulier. Tu pourrais calculer la moyenne des motifs et considérer que le suivant aura peu ou prou cette tête-là. Il faudrait déjà regarder si tous les motifs ont même durée.

Si c'est hors de porté tant pis pour moi, tels est l'avenir d'un STG (STMG)

Mouais… Tu peux aussi te replonger dans les maths. Il y a des cours sur Internet et des gens pour t'aider ici.

30/06/15 à 17h17

"Bienheureux celui qui sait rire de lui-même, il n’a pas fini de s’amuser." Joseph Folliet

+2 -0

asteqlik, mardi 30 juin 2015 à 17h24

Ben après ça semble tout de même sacrément régulier. Tu pourrais calculer la moyenne des motifs et considérer que le suivant aura peu ou prou cette tête-là. Il faudrait déjà regarder si tous les motifs ont même durée.

Oui cette exemple est assez régulier, mais j'en ai d'autre ou c'est en constante augmentation. Et on veut voir la suite.

J'ai déja fait la moyenne des motifs mais ca reste une moyenne non un prévisionnel..

http://www.hostingpics.net/viewer.php?id=505093Capture.png

Si c'est hors de porté tant pis pour moi, tels est l'avenir d'un STG (STMG)

Mouais… Tu peux aussi te replonger dans les maths. Il y a des cours sur Internet et des gens pour t'aider ici.

Je rigolais bien sur Je n'ai malheureusement pas le temps pour le moment de me re-plonger dans des cours, peut étre en fin d'année.

30/06/15 à 17h24

+0 -0

Vayel, mardi 30 juin 2015 à 17h29

Sinon, tu peux utiliser les fonctions toutes faites du package forecast de R.

30/06/15 à 17h29

"Bienheureux celui qui sait rire de lui-même, il n’a pas fini de s’amuser." Joseph Folliet

+0 -0

unidan, mardi 30 juin 2015 à 17h40
Modifié

Est-ce que tu parles du taux comme étant la mesure du débit à un instant donné ? (Qui correspondrait donc à l'ordonnée de ton graphe-signal)

Si c'est le cas, pour la moyenne, tu peux t'intéresser aux notions de moyennes mobiles, et là tu auras alors un signal lissé vers la moyenne (le lissage le plus puissant que tu peux faire étant de tout écraser sur la moyenne du signal), mais il va falloir que tu arrêtes de parler du "taux" quitte à paraphraser la notion que tu veux étudier avec des mots moins précis en l'illustrant avec des exemples.

Si tu as des notions de calcul infinitésimal/intégral, la notion de dérivée de fonction a pour "équivalent" dans les suites la différence $D(a_n)_n = a_{n+1}-a_n$ (où D est l'opérateur qui "dérive" la suite $(a_n)$, et donne donc une suite).

Tu peux le deviner en regardant les quotients $\frac{f(t+dt) - f(t)}{dt}$ par $\frac{f(t+1) - f(t)}{t+1-t} = f(t+1) - f(t)$, et d'ailleurs, $a_n$ est alors croissante ssi $D(a_n) >= 0$ pour tout $n$. Si tu as des variations dans ta suite, faire cette opération (et éventuellement la répéter) va donc les accentuer, et si tu as des termes qui ne varie peu, ils vont avoir tendance à disparaitre. En électronique, ça serait un filtre passe-haut (qui laisse passer les hautes fréquences).

La notion de moyenne au contraire, est plus liée à l'intégration : si tu définis l'opérateur $I$ par $I(a_n) = \sum_{i=n-N}^{n} a_i$, tu fais exactement une intégration (il faut imaginer le diagramme en bâton, tu intègres un premier bâton de largeur 1 et hauteur $a_{n-N}$, donc d'aire $1\cdot a_{n-N}$, puis tu fais pareil avec tous les bâtons, et en sommant tu as l'aire de tous les bâtons entre $a_{n-N}$ et $a_n$, donc c'est l'intégrale entre $a_{n-N}$ et $a_n$ de ton signal en bâton (en considérant qu'entre $t$ et $t+1$ ton signal ne varie quasiment pas).

Diviser ensuite par le nombre d'éléments sur lequel tu sommes, c'est une opération de "normalisation" ensuite. D'ailleurs la moyenne d'une fonction réelle continue est définie exactement de la même manière, mais avec une intégrale. Ici, c'est l'inverse, si tu as des composantes basses fréquences (presque constante) dans ton signal, elles vont avoir tendance à rester, et les hautes fréquences vont avoir tendance à partir.

Par contre, ça, c'est pour du traitement "simple et naïf" de ton signal, éliminer du bruit ou avoir un ordre d'idée de comment évolue ton signal. Si tu souhaites prévoir comment ton signal évolue, il y a différentes techniques plus ou moins complexe, la plus "standard" étant de passer par une transformée de Fourier pour retrouver les-dites fréquences. Ca te permet en particulier de "constater" dans des cas simples que tu as une montée en charge tous les week-end par exemple.

Le défaut de ça, c'est que ça ne fonctionne "vraiment" que sur des signaux périodiques, sinon les fréquences que tu obtiens ne sont pas forcément révélateur, et prendre en compte tous ces paramètres d'évolution risque d'arriver très rapidement hors de ta portée (et parfois hors de la portée de n'importe quoi si tu n'as pas assez de paramètre pris en compte).

Mais tu dois vraiment comprendre quels opérations tu as besoin de faire sur ton signal, et à quelle quantité correspond ton signal traité, ou tu te retrouveras avec un signal qui a l'air d'être ce que tu veux mais qui ne représente pas du tout ce que tu cherchais à calculer, ou à mal interpréter ce que ton signal donne comme information.

L'utilisation d'une bibliothèque me paraît indispensable si tu n'as ni le bagage mathématiques, ni un signal bien régulier, ni même le temps.

30/06/15 à 17h40
Modifié

+1 -0

Pas encore membre ?