Derniers messages sur Zeste de Savoirhttps://zestedesavoir.com/forums/2023-06-01T00:02:12+02:00Les derniers messages parus sur le forum de Zeste de Savoir.Comparaisons de similitudes entre des ensembles de nœuds dans des graphes, message #2506432023-06-01T00:02:12+02:00elegance/@elegancehttps://zestedesavoir.com/forums/sujet/16987/comparaisons-de-similitudes-entre-des-ensembles-de-nuds-dans-des-graphes/?page=1#p250643<p>Je ne suis pas sur d’avoir suivi, mais tentons cette réponse.</p>
<p>Tu as la situation A, par exemple ((1,2,3)(4,5)(6,7,8,9)), et tu as la situation B, par exemple ((1,2,3,4)(5,6,7)(8,9)), et tu cherches à calculer une certaine 'Distance' entre ces 2 situations.</p>
<p>On peut envisager un 'jeu’, et la règle de ce jeu, ce serait d’aller de A à B, avec les mouvements suivants : A chaque mouvement, on peut prendre une poignée de nombres dans un des sous-groupes, et soit créer un nouveau groupe avec cette poignée, soit ajouter cette poignée à un sous-groupe existant.</p>
<p>Et le but du jeu, c’est évidemment d’aller de la situation A à la situation B en un minimum de mouvements.</p>
<p>Par exemple à partir de ((1,2,3)(4,5)(6,7,8,9)), on déplace le 4, et on arrive à ((1,2,3,4)(5)(6,7,8,9)), puis on déplace la paire (6,7) et on arrive à ((1,2,3,4)(5,6,7)(8,9)) ; il fallait donc 2 mouvements pour aller de la position A à la position B.</p>
<p>La distance entre ces 2 positions était de 2.</p>
<p>Si c’est effectivement la règle que tu veux implémenter, il ne reste qu’à la programmer <img src="/static/smileys/svg/clin.svg" alt=";)" class="smiley"></p>Comparaisons de similitudes entre des ensembles de nœuds dans des graphes, message #2506402023-05-31T19:39:17+02:00Gawaboumga/@Gawaboumgahttps://zestedesavoir.com/forums/sujet/16987/comparaisons-de-similitudes-entre-des-ensembles-de-nuds-dans-des-graphes/?page=1#p250640<p>Bonjour tout le monde,</p>
<p>Je suis à la recherche d’idées afin d’effectuer des mesures statistiques pour comparer deux solutions. L’outil en question essaye de regrouper ensemble des nœuds dans un graphe. Et je souhaiterais mesurer à quel point ce regroupement est similaire à ce que fournit un autre outil.</p>
<p>Des exemples seront sans doute plus concret; supposons que je possède 3 éléments: A, B, C.</p>
<ul>
<li>1er cas = les mêmes: Outil 1 dit que A, B & C sont ensemble ainsi que l’outil 2 => parfait !</li>
<li>2e cas = en +: Outil 1 dit que A, B sont ensemble (et C isolé) tandis que l’outil 2 dit que ce sont 3 ensembles différents.</li>
<li>3e cas = en -: Outil 1 dit que ce sont 3 ensembles différents et outil 2 dit que B et C sont ensemble.</li>
<li>4e cas = en + et en -: Outil 1 dit que: A, B sont ensemble (et C isolé) tandis que l’outil 2 dit que B et C sont ensemble.</li>
</ul>
<p>Intuitivement, j’ai pensé à un notion de type: 'Jaccard Index’, mais je souhaiterais avoir une unité banane sur <em>tous</em> les cas. Un truc qui mesure tous les groupements au sein d’une même population qui passerait à la fois au travers de l’outil 1 et de l’outil 2. Je pensais partir vers un truc de type: 'Mutual information score' mais je ne sais pas si vous auriez d’autres recommandations à proposer. Ce qui serait vraiment parfait, c’est d’avoir des mesures de type: precision/recall, pour savoir si on essaye de minimiser les regroupements 'erronés’ (vrai négatif) ou maximiser les regroupements qu’on a manqué (faux positif).</p>
<p>Ici, on connaît chacun des éléments mais pas les 'classes’, si elles sont données à une permutation près, c’est bon. Je pense qu’on peut formuler cela comme une mesure du partitionnement.</p>
<p>Merci d’avance pour vos réponses !</p>Trouver les paramètres influant le plus un résultat, message #2394182021-12-07T13:25:43+01:00Demandred/@Demandredhttps://zestedesavoir.com/forums/sujet/15894/trouver-les-parametres-influant-le-plus-un-resultat/?page=1#p239418<p>Hello !
Tu peux simplement commencer par une régression linéaire multiple <img src="/static/smileys/svg/smile.svg" alt=":)" class="smiley"></p>Trouver les paramètres influant le plus un résultat, message #2393882021-12-06T19:09:19+01:00Migwel/@Migwelhttps://zestedesavoir.com/forums/sujet/15894/trouver-les-parametres-influant-le-plus-un-resultat/?page=1#p239388<figure><blockquote>
<p>Il y a des logiciels comme Dakota qui vont presque tout faire pour toi. Tu donnes l’intervalle sur lequel varier (pour autant de variables que tu veux), la sortie a vérifier, le type de sampling, et tu lances tout ça. Je ne sais plus si ça gère les variables discrètes par contre. C’est ce que tu cherches ? </p>
</blockquote><figcaption><a href="https://zestedesavoir.com/forums/sujet/15894/trouver-les-parametres-influant-le-plus-un-resultat/?page=1#p239384">Rockaround</a></figcaption></figure>
<p>C’est plus ou moins ce que je cherche. Je m’intéresse plus à ceci d’un point de vue pédagogique, pour apprendre comment faire ce genre d’analyse. Donc je suis plus intéressé par les méthodes mathématiques sous-jacentes pour les apprendre puis les appliquer à mon problème.</p>
<p>Cela dit, je vais tout de même jeter un oeil à Dakota pour voir si ça peut m’être utile ici, merci !</p>Trouver les paramètres influant le plus un résultat, message #2393852021-12-06T17:21:12+01:00elegance/@elegancehttps://zestedesavoir.com/forums/sujet/15894/trouver-les-parametres-influant-le-plus-un-resultat/?page=1#p239385<p>Pur les variables discrètes, le mot-clé qui me vient à l’esprit, c’est Variance inter et intra-classe.</p>Trouver les paramètres influant le plus un résultat, message #2393842021-12-06T16:56:58+01:00Rockaround/@Rockaroundhttps://zestedesavoir.com/forums/sujet/15894/trouver-les-parametres-influant-le-plus-un-resultat/?page=1#p239384<p>Il y a des logiciels comme Dakota qui vont presque tout faire pour toi. Tu donnes l’intervalle sur lequel varier (pour autant de variables que tu veux), la sortie a vérifier, le type de sampling, et tu lances tout ça. Je ne sais plus si ça gère les variables discrètes par contre. C’est ce que tu cherches ? </p>Trouver les paramètres influant le plus un résultat, message #2393812021-12-06T15:38:37+01:00Migwel/@Migwelhttps://zestedesavoir.com/forums/sujet/15894/trouver-les-parametres-influant-le-plus-un-resultat/?page=1#p239381<p>Salut à tous,
Ca fait des années que je n’ai plus fait de statistiques et pour m’amuser, je voulais essayer d’analyser quelque chose mais je ne suis pas sûr de la direction que je dois prendre.</p>
<p>Sans rentrer trop dans les détails, j’ai un procédé quelconque qui prend en entrée un certain nombre de paramètres. Certains de ces paramètres peuvent prendre des valeurs non-contraintes tandis que d’autres ne peuvent prendre qu’un nombre limité de valeurs (exemple: jour de la semaine). Ce procédé prend ces paramètres et génère une sortie. Je n’ai aucune vue sur comment ce procédé fonctionne donc je ne peux pas "inspecter le code" pour essayer de comprendre comment il détermine la sortie.</p>
<p>Ce que j’aimerais faire, c’est une analyse statistique afin de trouver quel(s) paramètre(s) semble(nt) avoir la plus grande influence sur la sortie. Pourriez-vous m’aiguiller sur l’approche à appliquer ici ?</p>Test du khi2 vs coefficient de corrélation, message #2385582021-10-25T10:16:01+02:00Paré Seydou/@Par%C3%A9%20Seydouhttps://zestedesavoir.com/forums/sujet/6444/test-du-khi2-vs-coefficient-de-correlation/?page=1#p238558<p>Le test de khi-deux s’applique lorsque les deux variables que l’on veut tester sont qualitatives alors que le test de corrélation linéaire s’applique lorsque l’on veut tester deux variables quantitatives</p>Statistique et corrélation, message #2379722021-10-05T09:50:48+02:00elegance/@elegancehttps://zestedesavoir.com/forums/sujet/15747/statistique-et-correlation/?page=1#p237972<p>Ces 2 vidéos sont vraiment très sympas.</p>
<p>Mais comme c’est dit dans ces vidéos, les critères qui permettent d’arbitrer entre causalité et simple corrélation ne sont pas (tous) des critères mathématiques.</p>
<p>Il y a une corrélation entre consommation de tabac et cancer du poumon. Tabac, voies respiratoires, poumons … il y a une logique. Donc le critère de Bradford-Hill correspondant est respecté.</p>
<p>Si on avait les mêmes mesures, les mêmes chiffres, les mêmes résultats sur la consommation de tabac et le cancer du genou, on ne parlerait pas de causalité mais de corrélation.</p>Statistique et corrélation, message #2379672021-10-04T22:22:36+02:00anonyme/@anonymehttps://zestedesavoir.com/forums/sujet/15747/statistique-et-correlation/?page=1#p237967<p><a href="/@elegance" rel="nofollow" class="ping ping-link">@<span class="ping-username">elegance</span></a> J’ai lu ça dans un livre ou un magazine, un jour à la bibliothèque, mais j’ignore quand, ni quel était le livre…</p>
<p><a href="/@Looping" rel="nofollow" class="ping ping-link">@<span class="ping-username">Looping</span></a> Oui ! Ça me dit quelque chose, je ne sais pas si c’est exactement ça que je cherche, mais je crois qu’ils en parlaient. (les critères de Bradford Hill)</p>Statistique et corrélation, message #2379552021-10-04T10:24:29+02:00Looping/@Loopinghttps://zestedesavoir.com/forums/sujet/15747/statistique-et-correlation/?page=1#p237955<p>La "<strong>variance expliquée</strong>" ?<br>
<a href="https://www.youtube.com/watch?v=MSuFckow8ms">https://www.youtube.com/watch?v=MSuFckow8ms</a><br>
(Dans la vidéo il prend l’exemple du salaire homme-femme et essaie de déterminer quelle part de la différence est liée à la différence de diplôme et laquelle est due à une discrimination)</p>
<p>Sinon il y a aussi <strong>les critères de Bradford Hill</strong> qui permettent de rechercher la causalité dans une corrélation :<br>
<a href="https://www.youtube.com/watch?v=aqMyngADnMU">https://www.youtube.com/watch?v=aqMyngADnMU</a><br>
Ici, il prend l’exemple de la corrélation tabac-cancer</p>Statistique et corrélation, message #2379272021-10-02T23:21:24+02:00elegance/@elegancehttps://zestedesavoir.com/forums/sujet/15747/statistique-et-correlation/?page=1#p237927<p>La part de causalité vs la part de corrélation ??? J’ai de très gros doutes. </p>
<p>Et tu aurais vu ça dans quel cursus scolaire/étudiant/autre ? </p>Statistique et corrélation, message #2379172021-10-02T16:16:39+02:00anonyme/@anonymehttps://zestedesavoir.com/forums/sujet/15747/statistique-et-correlation/?page=1#p237917<p>Je connais la différence entre causalité et corrélation, mais ce n’est pas de ça dont je voulais parler et je n’aurais peut-être pas dû employer ce terme…</p>
<p>En fait, sur un événement dont on ne connaît pas sa cause exacte on va dire que c’est (par exemple) le réchauffement climatique alors que beaucoup de facteurs entrent en jeu. Mais pour savoir si c’est bien le réchauffement climatique qui est l’une des causes majeurs de l’événement il y a un outil statistique dont j’ai oublié le nom et ça me pose problème.</p>
<p>PS: De souvenir, ça permettait de calculer la part de causalité et la part de corrélation d’un évènement par rapport à un autre, mais je ne sais pas si c’est bien ça.</p>Statistique et corrélation, message #2379162021-10-02T15:39:49+02:00Renault/@Renaulthttps://zestedesavoir.com/forums/sujet/15747/statistique-et-correlation/?page=1#p237916<p>Tout dépend de quoi tu parles en fait.</p>
<p>Déjà dans ce qu’on voit dans la presse, il y a souvent confusion entre corrélation et causalité. Définir une causalité en science est vraiment compliquée, ça demande des analyses et des études plus coûteuses qu’une simple corrélation.</p>
<p>Concernant le réchauffement climatique, ce qu’il faut savoir c’est que le climat est un système chaotique, on ne peut jamais attribuer à un phénomène une cause exacte. Le réchauffement climatique rend plus probables certaines évènements violents comme les tempêtes, les inondations que quand il n’y en a pas. Mais un climat qui ne se réchauffe pas a aussi ces phénomènes, juste moins souvent. Donc pour dire qu’un évènement précis est du au réchauffement climatique à 50% ou 100%, difficile à dire. Mais la collection de ces évènements sur une année ou une décennie, là ça devient plus facile.</p>
<p>Tu peux jouer aussi sur ce qu’on appelle le temps de retour d’un évènement. Ce qu’on nomme souvent improprement une crue décennale, ou centennale. C’est*à-dire par exemple une inondation d’une ampleur qui n’est en moyenne que de 10 ans ou 100 ans dans une région donnée. Le fait d’avoir un temps de retour qui est plus faible aujourd’hui qu’hier peut être le signe d’un impact du réchauffement climatique.</p>Statistique et corrélation, message #2379152021-10-02T15:38:56+02:00Gabbro/@Gabbrohttps://zestedesavoir.com/forums/sujet/15747/statistique-et-correlation/?page=1#p237915<p>Bonjour,</p>
<p>Quand quelqu’un dit « c’est dû à », il ne faut pas lien de corrélation, mais un lien de cause à effet. Ce n’est pas pareil.</p>
<p>En stat, on travaille sur de gros tas de données. Donc, on ne peut pas dire pour <em>une</em> tempête la part due au changement climatique. On peut estimer le nombre de tempête de cette force que l’on devrai avoir par décennie, constater qu’on en a plus, de manière significative, vérifier que nos modèles climatiques associent bien une augmentation de la température globale avec une hausse du nombre ou de la force des tempêtes, et conclure à un probable lien de cause à effet. Pour avoir la part précise, dans un environnement multi-factoriel, c’est quasi-impossible. Ne serait-ce qu’à cause des interactions : s’il faut deux phénomènes A et B en même pour voir un effet, comment attribuer la part de A et celle de B ?</p>
<p>Les outils outils statistiques, il en a plein. Les coefficients de corrélation, par exemple. Encore une fois, attention à l’interprétation. Un coefficient de corrélation de 1 signifie que les deux phénomènes étudiées varient pareil, pas que l’un dépend de l’autre.</p>Statistique et corrélation, message #2379142021-10-02T14:17:28+02:00anonyme/@anonymehttps://zestedesavoir.com/forums/sujet/15747/statistique-et-correlation/?page=1#p237914<p>Bonjour,</p>
<p>Il m’arrive de me poser la question lorsque je vois un article ou un reportage à la télévision, concernant le réchauffement climatique. En fait, parfois ils disent « c’est dû au réchauffement climatique » pour un évènement donné. Sauf que pour une tempête, comment savoir la part que prend le réchauffement climatique dans sa manifestation? Je sais qu’il y a un outil statistique qui permet de donner approximativement cette part, mais je ne me souviens plus de son nom.</p>
<p>Auriez-vous une idée ? Merci <img src="/static/smileys/svg/smile.svg" alt=":)" class="smiley"> </p>Erreur d'arrondi ?, message #2072482019-08-12T10:16:28+02:00pierre_24/@pierre_24https://zestedesavoir.com/forums/sujet/12853/erreur-darrondi/?page=1#p207248<p>Bien vu, j’avais pas réfléchi que c’était simplement une loi uniforme <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mo>[</mo><mo>−</mo><mn>0.5</mn><mo separator="true">;</mo><mn>0.5</mn><mo>[</mo></mrow><annotation encoding="application/x-tex">[-0.5;0.5[</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">[</span><span class="mord">−</span><span class="mord">0</span><span class="mord">.</span><span class="mord">5</span><span class="mpunct">;</span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord">0</span><span class="mord">.</span><span class="mord">5</span><span class="mopen">[</span></span></span></span></span>. Du coup, Wikipédia m’apprend que la somme de deux variable uniforme est une <a href="https://en.wikipedia.org/wiki/Triangular_distribution">loi triangulaire</a>, et que je vais peu ou prou finir sur <a href="https://en.wikipedia.org/wiki/Central_limit_theorem">une loi normale</a> si je continue de les additionner. En "pratique", dans mon cas, <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi>n</mi><mo>≈</mo><mn>10</mn></mrow><annotation encoding="application/x-tex">n\approx 10</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.48312em;vertical-align:0em;"></span><span class="mord mathdefault">n</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">≈</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</span><span class="mord">0</span></span></span></span></span>, ce qui fait que je dois me trouver quelque par dans la <a href="https://en.wikipedia.org/wiki/Irwin%E2%80%93Hall_distribution">distribution d’Irwin-Hall</a> (enfin, presque, puisque là c’est une somme de distribution uniforme <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mo>[</mo><mn>0</mn><mo separator="true">;</mo><mn>1</mn><mo>[</mo></mrow><annotation encoding="application/x-tex">[0;1[</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">[</span><span class="mord">0</span><span class="mpunct">;</span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord">1</span><span class="mopen">[</span></span></span></span></span> et que moi je suis <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mo>[</mo><mo>−</mo><mn>0.5</mn><mo separator="true">;</mo><mn>0.5</mn><mo>[</mo></mrow><annotation encoding="application/x-tex">[-0.5;0.5[</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">[</span><span class="mord">−</span><span class="mord">0</span><span class="mord">.</span><span class="mord">5</span><span class="mpunct">;</span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord">0</span><span class="mord">.</span><span class="mord">5</span><span class="mopen">[</span></span></span></span></span>, mais je vois l’idée). </p>
<p>EDIT: vu que <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi>n</mi><mo>≈</mo><mn>10</mn></mrow><annotation encoding="application/x-tex">n\approx 10</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.48312em;vertical-align:0em;"></span><span class="mord mathdefault">n</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">≈</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">1</span><span class="mord">0</span></span></span></span></span>, je vais approximer ça par une normale.</p>Erreur d'arrondi ?, message #2072442019-08-12T01:15:02+02:00elegance/@elegancehttps://zestedesavoir.com/forums/sujet/12853/erreur-darrondi/?page=1#p207244<p>Quand on a un seul 'tirage’, l’erreur due à l’arrondi suit une loi uniforme, entre -0.5 et +0.5. Du coup, tu te débarasses de la 2ème série (la loi de Bernouilli), et c’est plutôt une bonne chose, puisque les 2 v.a. en question n’étaient pas indépendantes du tout.</p>
<p>Tu t’intéresses donc à la somme de n fois cette loi uniforme. Tu dois pouvoir trouver plein de littérature sur le sujet.</p>Erreur d'arrondi ?, message #2072422019-08-11T23:36:14+02:00pierre_24/@pierre_24https://zestedesavoir.com/forums/sujet/12853/erreur-darrondi/?page=1#p207242<p>Bonsoir,</p>
<p>On m’a soumis un problème "marrant", auquel la solution doit être relativement évidente, même si je ne la trouve pas.</p>
<p>Soit la fonction d’arrondi suivante:</p>
<div class="math"><span class="katex-display"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi>a</mi><mi>r</mi><mi>r</mi><mi>o</mi><mi>n</mi><mi>d</mi><mi>i</mi><mo>(</mo><mi>x</mi><mo>)</mo><mo>=</mo><mrow><mo fence="true">{</mo><mtable><mtr><mtd><mstyle scriptlevel="0" displaystyle="false"><mrow><mo>⌊</mo><mi>x</mi><mo>⌋</mo></mrow></mstyle></mtd><mtd><mstyle scriptlevel="0" displaystyle="false"><mrow><mtext>si </mtext><mo>(</mo><mi>x</mi><mo>−</mo><mo>⌊</mo><mi>x</mi><mo>⌋</mo><mo>)</mo><mo><</mo><mfrac><mn>1</mn><mn>2</mn></mfrac></mrow></mstyle></mtd></mtr><mtr><mtd><mstyle scriptlevel="0" displaystyle="false"><mrow><mo>⌈</mo><mi>x</mi><mo>⌉</mo></mrow></mstyle></mtd><mtd><mstyle scriptlevel="0" displaystyle="false"><mtext>sinon</mtext></mstyle></mtd></mtr></mtable></mrow></mrow><annotation encoding="application/x-tex">arrondi(x)=\begin{cases}
\lfloor x \rfloor & \text{si } (x-\lfloor x \rfloor) < \frac{1}{2}\\
\lceil x \rceil & \text{sinon}
\end{cases}</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault">a</span><span class="mord mathdefault" style="margin-right:0.02778em;">r</span><span class="mord mathdefault" style="margin-right:0.02778em;">r</span><span class="mord mathdefault">o</span><span class="mord mathdefault">n</span><span class="mord mathdefault">d</span><span class="mord mathdefault">i</span><span class="mopen">(</span><span class="mord mathdefault">x</span><span class="mclose">)</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.0000299999999998em;vertical-align:-1.25003em;"></span><span class="minner"><span class="mopen delimcenter" style="top:0em;"><span class="delimsizing size4">{</span></span><span class="mord"><span class="mtable"><span class="col-align-l"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.69em;"><span style="top:-3.69em;"><span class="pstrut" style="height:3.008em;"></span><span class="mord"><span class="mopen">⌊</span><span class="mord mathdefault">x</span><span class="mclose">⌋</span></span></span><span style="top:-2.25em;"><span class="pstrut" style="height:3.008em;"></span><span class="mord"><span class="mopen">⌈</span><span class="mord mathdefault">x</span><span class="mclose">⌉</span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.19em;"><span></span></span></span></span></span><span class="arraycolsep" style="width:1em;"></span><span class="col-align-l"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.69em;"><span style="top:-3.69em;"><span class="pstrut" style="height:3.008em;"></span><span class="mord"><span class="mord text"><span class="mord">si </span></span><span class="mopen">(</span><span class="mord mathdefault">x</span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">−</span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mopen">⌊</span><span class="mord mathdefault">x</span><span class="mclose">⌋</span><span class="mclose">)</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel"><</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mord"><span class="mopen nulldelimiter"></span><span class="mfrac"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.845108em;"><span style="top:-2.6550000000000002em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">2</span></span></span></span><span style="top:-3.23em;"><span class="pstrut" style="height:3em;"></span><span class="frac-line" style="border-bottom-width:0.04em;"></span></span><span style="top:-3.394em;"><span class="pstrut" style="height:3em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mtight"><span class="mord mtight">1</span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.345em;"><span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span></span></span><span style="top:-2.25em;"><span class="pstrut" style="height:3.008em;"></span><span class="mord"><span class="mord text"><span class="mord">sinon</span></span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.19em;"><span></span></span></span></span></span></span></span><span class="mclose nulldelimiter"></span></span></span></span></span></span></div>
<p>(ce qui est une manière un peu <em>fancy</em> de dire "arrondi à l’entier inférieur si la partie décimale est plus petite que 0.5, au dessus sinon")</p>
<p>Imaginons maintenant que je tire <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi>N</mi></mrow><annotation encoding="application/x-tex">N</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.68333em;vertical-align:0em;"></span><span class="mord mathdefault" style="margin-right:0.10903em;">N</span></span></span></span></span> nombres flottant entre 0 et 1, que je note <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><msub><mi>n</mi><mi>i</mi></msub></mrow><annotation encoding="application/x-tex">n_i</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.58056em;vertical-align:-0.15em;"></span><span class="mord"><span class="mord mathdefault">n</span><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">i</span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span></span></span></span></span>. Je calcule ce que j’appelle l’erreur d’arrondi de la manière suivante:</p>
<div class="math"><span class="katex-display"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi>E</mi><mo>(</mo><mi>N</mi><mo>)</mo><mo>=</mo><mi>a</mi><mi>r</mi><mi>r</mi><mi>o</mi><mi>n</mi><mi>d</mi><mi>i</mi><mo>(</mo><munderover><mo>∑</mo><mi>i</mi><mi>N</mi></munderover><msub><mi>n</mi><mi>i</mi></msub><mo>)</mo><mo>−</mo><munderover><mo>∑</mo><mi>i</mi><mi>N</mi></munderover><mi>a</mi><mi>r</mi><mi>r</mi><mi>o</mi><mi>n</mi><mi>d</mi><mi>i</mi><mo>(</mo><msub><mi>n</mi><mi>i</mi></msub><mo>)</mo></mrow><annotation encoding="application/x-tex">E(N) = arrondi(\sum_i^N n_i) - \sum_i^N arrondi(n_i)</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathdefault" style="margin-right:0.05764em;">E</span><span class="mopen">(</span><span class="mord mathdefault" style="margin-right:0.10903em;">N</span><span class="mclose">)</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:3.106005em;vertical-align:-1.277669em;"></span><span class="mord mathdefault">a</span><span class="mord mathdefault" style="margin-right:0.02778em;">r</span><span class="mord mathdefault" style="margin-right:0.02778em;">r</span><span class="mord mathdefault">o</span><span class="mord mathdefault">n</span><span class="mord mathdefault">d</span><span class="mord mathdefault">i</span><span class="mopen">(</span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.8283360000000002em;"><span style="top:-1.872331em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">i</span></span></span><span style="top:-3.050005em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">∑</span></span></span><span style="top:-4.3000050000000005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.277669em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord"><span class="mord mathdefault">n</span><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">i</span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose">)</span><span class="mspace" style="margin-right:0.2222222222222222em;"></span><span class="mbin">−</span><span class="mspace" style="margin-right:0.2222222222222222em;"></span></span><span class="base"><span class="strut" style="height:3.106005em;vertical-align:-1.277669em;"></span><span class="mop op-limits"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:1.8283360000000002em;"><span style="top:-1.872331em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">i</span></span></span><span style="top:-3.050005em;"><span class="pstrut" style="height:3.05em;"></span><span><span class="mop op-symbol large-op">∑</span></span></span><span style="top:-4.3000050000000005em;margin-left:0em;"><span class="pstrut" style="height:3.05em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight" style="margin-right:0.10903em;">N</span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:1.277669em;"><span></span></span></span></span></span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord mathdefault">a</span><span class="mord mathdefault" style="margin-right:0.02778em;">r</span><span class="mord mathdefault" style="margin-right:0.02778em;">r</span><span class="mord mathdefault">o</span><span class="mord mathdefault">n</span><span class="mord mathdefault">d</span><span class="mord mathdefault">i</span><span class="mopen">(</span><span class="mord"><span class="mord mathdefault">n</span><span class="msupsub"><span class="vlist-t vlist-t2"><span class="vlist-r"><span class="vlist" style="height:0.31166399999999994em;"><span style="top:-2.5500000000000003em;margin-left:0em;margin-right:0.05em;"><span class="pstrut" style="height:2.7em;"></span><span class="sizing reset-size6 size3 mtight"><span class="mord mathdefault mtight">i</span></span></span></span><span class="vlist-s"></span></span><span class="vlist-r"><span class="vlist" style="height:0.15em;"><span></span></span></span></span></span></span><span class="mclose">)</span></span></span></span></span></div>
<p>(Encore une fois, une façon un peu <em>fancy</em> de dire "l’erreur, c’est la différence entre l’arrondi effectué à priori ou à postériori", ou autrement dit "quelle erreur ont effectue en additionnant des nombres arrondi")</p>
<p>Et maintenant, imaginons que je fasse ça un grand nombre de fois, ce qui me permet de rentrer dans le doux domaine des statistiques. Instinctivement, je me doute bien que <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi mathvariant="double-struck">E</mi><mo>[</mo><mi>E</mi><mo>(</mo><mi>N</mi><mo>)</mo><mo>]</mo><mo>=</mo><mn>0</mn></mrow><annotation encoding="application/x-tex">\mathbb{E}[E(N)] = 0</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathbb">E</span></span><span class="mopen">[</span><span class="mord mathdefault" style="margin-right:0.05764em;">E</span><span class="mopen">(</span><span class="mord mathdefault" style="margin-right:0.10903em;">N</span><span class="mclose">)</span><span class="mclose">]</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">0</span></span></span></span></span>, autrement dit que la moyenne des erreurs est de zéro. Mais disons que ce qui m’intéresse, c’est plutôt la variance, donc en résumé la probabilité de "me tromper".</p>
<p>Si j’ai envie de faire un peu de math, je me dit que <em>in fine</em>, il s’agit de la différence entre <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi>n</mi></mrow><annotation encoding="application/x-tex">n</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">n</span></span></span></span></span> nombres pris dans une distribution uniforme <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mo>[</mo><mn>0</mn><mo separator="true">;</mo><mn>1</mn><mo>[</mo></mrow><annotation encoding="application/x-tex">[0;1[</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">[</span><span class="mord">0</span><span class="mpunct">;</span><span class="mspace" style="margin-right:0.16666666666666666em;"></span><span class="mord">1</span><span class="mopen">[</span></span></span></span></span> et ces mêmes <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi>n</mi></mrow><annotation encoding="application/x-tex">n</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.43056em;vertical-align:0em;"></span><span class="mord mathdefault">n</span></span></span></span></span> nombres pris dans une loi de Bernoulli. Sauf que la distribution que je souhaite étudiant est la différence entre les deux. Le théorème central limite étant de mon côté sur celle là, il m’a suffit de coder un script pour me rendre compte que en effet, <span class="inlineMath"><span class="katex"><span class="katex-mathml"><math><semantics><mrow><mi mathvariant="double-struck">E</mi><mo>[</mo><mi>E</mi><mo>(</mo><mi>N</mi><mo>)</mo><mo>]</mo><mo>=</mo><mn>0</mn></mrow><annotation encoding="application/x-tex">\mathbb{E}[E(N)] = 0</annotation></semantics></math></span><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord"><span class="mord mathbb">E</span></span><span class="mopen">[</span><span class="mord mathdefault" style="margin-right:0.05764em;">E</span><span class="mopen">(</span><span class="mord mathdefault" style="margin-right:0.10903em;">N</span><span class="mclose">)</span><span class="mclose">]</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2777777777777778em;"></span></span><span class="base"><span class="strut" style="height:0.64444em;vertical-align:0em;"></span><span class="mord">0</span></span></span></span></span>, et que j’avais une gaussienne dont je peux probablement calculer la moyenne et la variance par <em>fit</em>. Néanmoins, est ce qu’il est possible d’obtenir une expression pour ladite variance ? </p>
<p>D’avance merci <img src="/static/smileys/clin.png" alt=";)" class="smiley"></p>Savoir quand un changement est statistiquement significatif, message #1635742017-10-03T17:59:07+02:00Freedom/@Freedomhttps://zestedesavoir.com/forums/sujet/9443/savoir-quand-un-changement-est-statistiquement-significatif/?page=1#p163574<p>Comme point d’entrée, regarde : </p>
<p><a href="https://en.wikipedia.org/wiki/Mean_squared_error">https://en.wikipedia.org/wiki/Mean_squared_error</a></p>
<p>Je ne garantie pas que l’approche que je propose soit parfaite, mais c’est ce sur quoi je partirais.</p>Savoir quand un changement est statistiquement significatif, message #1635722017-10-03T17:47:53+02:00Gabbro/@Gabbrohttps://zestedesavoir.com/forums/sujet/9443/savoir-quand-un-changement-est-statistiquement-significatif/?page=1#p163572<p>Merci beaucoup. <img alt=":)" src="/static/smileys/smile.png"></p>
<p>J’ai encore un peu de mal à visualiser ce que représente <span>$\sigma_s$</span>, il faudra que je revois ça à tête reposée (je suis largement en dehors de ma zone de confort).</p>
<p>Je vais lancer <em>quelques</em> simulations pour voir ce que ça donne sur des cas que je soupçonne fort d’avoir très peu d’influence et d’autre pour lesquels je sais que ça en a de fortes et voir ce que ça donne.</p>
<p>Encore merci.</p>