Caf&Sciences

Le coin des scientifiques !

a marqué ce sujet comme résolu.

Beaucoup plus terre-à-terre, un billet sur les sur-diagnostiques lors des dépistages.

Ça fait un moment que je lis ça et là qu'il y aurait des sur-diagnostique massifs, en particulier dans le cas des cancers de la prostate. Là, le billet est très pédagogique, et très bien sourcé. Et qui pèse le pour et le contre correctement, en évitant les excès, dans un sens comme dans l'autre.

Je recommande fortement la lecture, en particulier si vous ou vos parents avez dans les 50 ans et qu'on commence à vous parler avec insistance de dépistage du cancer de la prostate.

+3 -0

On a peut-être trouvé une asymétrie entre le matière et l'antimatière. Les antineutrinos n'oscilleraient pas de la même manière que les neutrinos.

Source.

Tout ça est à mettre au conditionnel, ils sont à 95 % de probabilité de justesse (2 sigmas dans le jargon). Récemment, le CERN a annoncé qu'une découverte potentiel, à 3 sigmas (99,5 %), était un effet statistique. Les 3 sigmas seront atteints en 2020, et les 5 sigmas (99,99995 %) nécessaires pour valider des résultats en physique des particules ne pourront être atteints qu'avec un matériel plus avancé.

Bref, quelque chose de très intéressant, même si on est loin de pouvoir déboucher le champagne.

+0 -0

En gros il y a deux problèmes (si l'on met de côté l'extrême minorité de scientifiques qui trichent volontairement):

  • Le système de compétition et de survie par la publication.
  • Une incapacité à manipuler correcter les données et comprendre ce que signifient les différents tests statistiques (puisque globalement un physicien ou psychologue utilise les tests statistiques comme j'utilise ma voiture).

J'ai bien peur que cela ne va faire qu'empirer au fur et à mesure où l'on destine le traitement des données et l'apprentissage artificiel non-analytique au commun des mortels…

On peut mentionner Hygiène mentale également qui a fait une vidéo (vaguement) sur le même sujet et qui parle de certains biais: ici.

puisque globalement un physicien ou psychologue utilise les tests statistiques comme j'utilise ma voiture

Ça, j'en suis pas sûr du tout. En tout cas, chez nous, le cours de stat' est particulièrement poussé pour les physiciens et les biologistes.

(et puis en pratique, je connais très peux de matheux qui ont vraiment envie de s'intéresser à ce qu'on fait)

+2 -0

Moi je vois au contraire beaucoup de matheux qui vont travailler avec leurs collègues biologistes, physiciens et informaticiens.

Quand tu dis poussé, ça veut dire jusqu'où ? Vous avez un vrai cours de maths ?

Je parle pour ce que je vois de mon école. Mais à l'ENS, à moins de prendre 36 crédits de formation mathématique, t'es pas compétent en stat et proba. Du coup la quasi totalité des gens formés (dans une école avec une excellente réputation tout de même) ne savent pas trop ce qu'ils font.

Mais à l'ENS, à moins de prendre 36 crédits de formation mathématique, t'es pas compétent en stat et proba. Du coup la quasi totalité des gens formés (dans une école avec une excellente réputation tout de même) ne savent pas trop ce qu'ils font.

Si effectivement pour toi "savoir faire des stats" c'est "savoir faire des maths" (puisque 36 crédits de formations mathématiques, c'est plus de la moitié d'une année), alors effectivement, non, personne ne sais faire des stats. Bon, je vais pas me lancer dans ce débat là parce que je ne les ai pas eu, mais je suis pas convaincu que ce soit réellement nécessaire.

Moi je vois au contraire beaucoup de matheux qui vont travailler avec leurs collègues biologistes, physiciens et informaticiens.

Pas moi. Et pourtant, je suis dans la chimie théorique, ce qui signifie que de temps à autres, on aurait bien besoin d'un coup de main sur certaines équations. Je vois très très peu de "vrai" mathématiciens sortir des papiers dans le domaine (en fait, j'en connais qu'un et il est mort l'an passé), en général, on tient nos dévellopements mathématiques des physiciens. Connaissant la haute estime que tu portes aux maths, et le fait que "on peut pas comprendre tant qu'on c'est pas mangé 36 crédits de formation mathématique", ben … Je fait n'importe quoi :p

+0 -0

Si effectivement pour toi "savoir faire des stats" c'est "savoir faire des maths" (puisque 36 crédits de formations mathématiques, c'est plus de la moitié d'une année), alors effectivement, non, personne ne sais faire des stats. Bon, je vais pas me lancer dans ce débat là parce que je ne les ai pas eu, mais je suis pas convaincu que ce soit réellement nécessaire.

Je parlais de la formation à l'ENS, parce que dans leurs départements, ils n'ont pas de cours sérieux. Je ne dis pas qu'il faut faire des maths pour avoir des compétences, c'était peut-être un peu maladroit comme formulation.

En revanche, je suis toujours un peu sceptique quand on me dit qu'on peut comprendre ce qui est fait en stat sans avoir la moindre idée de ce qu'il se passe mathématiquement, d'où mon interrogation sur ta formation et ce que tu appelles solide.

+0 -0

En revanche, je suis toujours un peu sceptique quand on me dit qu'on peut comprendre ce qui est fait en stat sans avoir la moindre idée de ce qu'il se passe mathématiquement […]

J'ai décidément un problème avec cette phrase. Je vais exagérer, mais j'ai l'impression que tu dis qu'un ouvrier devrait comprendre le fonctionnement du béton pour pouvoir l'utiliser. Ou que je devrais connaitre le fonctionnement d'un moteur 4 temps pour pouvoir conduire ma voiture. C'est caricatural, mais ce sont juste des "outils", dont on a pas besoin de connaitre les détails pour pouvoir les utiliser. C'est encore plus flagrant en cuisine: personne n'as eu de cours de chimie pour apprendre comment on cuisine, si ? Pourtant c'est de la p*** de chimie !

J'ai l'impression que pour toi, les maths ne peuvent jamais être employés comme des outils (ce qui est le cas la plupart du temps en sciences), en tout cas sans avoir fait des "vrai" maths avant. Sauf que quand on fait biologie, par exemple, ben on a autre chose à faire que de faire 36 crédits de maths pour pouvoir comprendre le comment du pourquoi d'un test statistique (même si ça devrait probablement être le cas, on a pas le temps).

Du coup la quasi totalité des gens formés (dans une école avec une excellente réputation tout de même) ne savent pas trop ce qu'ils font […]

Probablement. Et après ? Et ce que ça vaut la peine de rejeter tout ce qu'ils font ? Bizarrement, j'ai l'impression que des gens qui "ne savent pas trop ce qu'ils font" s'en sortent quand même assez bien pour pondre des résultats cohérents, qui tiennent la route, et qui sont reproductible. Et ça empêche pas le monde de tourner. Bien sur, il faut avoir eu "un minimum" d'heures de stats pour savoir quel test employer dans quel cas (tout comme il faut apprendre à conduire), mais pas besoin de se taper les axiomes ZFC pour savoir comment additionner un nombre, quoi.

Estime toi déjà heureux que lesdits tests statistiques soient employés, t'imagine le bordel que ça serait si ça n'était pas le cas ?

En plus, la théorie sur le papier, c'est très joli, mais dans le monde réel, ton doctorat en statistiques va se heurter à la complexité du monde réel, dans lequel le nombre de variables indépendantes à contrôler est quasiment aussi long que le nombre de décimales de pi. Et ça, c'est sans prendre en compte les expériences avec le vivant, qui rallonge la liste des dites variables d'au moins tout ça (donc certaines parfaitement incontrôlables). Du coup, si tu devais vraiment bosser convenablement, ça te prendrait un temps bête pour tester tout les facteurs (dont certains sont intestables), et ça te demanderait une puissance de calcul énorme pour faire après les fameux tests statistiques. Et là, heures de maths ou pas, tout le monde est capable de lancer un programme de statistique pour le faire.

+4 -0

@pierre_24 : si globalement je vois ce que tu veux dire, il faut quand même prendre conscience que faire un test statistique et surtout pouvoir l'interpréter correctement, ça nécessite de comprendre un minimum les maths qui sont derrières. Je connais des gens qui font des ACP sur des simplexes sans broncher et qui passent le peer-review sans problème parce qu'il y en a pas un dans le tas qui a compris pourquoi il fallait ouvrir le dit simplexe avant de faire le test.

Il y a aussi des gens qui font les dites ACP après avoir joyeusement ouvert leur simplexe (en comprenant ou pas pourquoi) et qui derrière se servent du résultat des ACP pour projeter leur données dans un domaine à deux dimensions et construire un système de n>2 pôles purs dans lequel leurs données se baladent, sans comprendre que ça revient à ajouter de la dimensionnalité artificielle qui n'a pas grand sens et fortement dépendante de la position des mesures extrêmes.

Toutes ces erreurs sont faites par des gens qui n'ont aucune base (pun intended) d'algèbre linéaire, alors que c'est quand même l'un des trucs les plus simples que tu puisses trouver en maths.

Je suis pas un matheux personnellement, mais j'ai parfois la désagréable sensation que certaines personnes appliquent leurs maths comme de bêtes outils sans prendre le temps de regarder le mode d'emploi des dits outils. Résultat, ils se trouvent à visser avec un marteau et en concluent que leur vis était bien un clou déguisé, ce sont les méchants matheux cryptiques qui voudraient nous faire croire qu'il y a une différence entre les deux, et que non, mettre une vis avec un marteau, c'est pas une bonne idée. Qu'importe, ça donne un résultat quand même !

Conduire une voiture requiert tres peu de connaissances sur le fonctionnement theorique et ses limites. C'est justement la ou la comparaison s'arrete avec les statistiques et les probabilites. C'est un outil bien plus complexe qui requiert de l'expertise pointue pour le traitement et les interpretations des donnees. C'est un metier. Et la comprehension de la reelle signification d'un test ou d'une methode quelconque passe malheureusement en partie au moins par la comprehension des mathematiques sous-jacentes de maniere bien plus profonde que pour d'autres outils.

En particulier, oui, en biologie tu peux utiliser des mathematiques comme outil, par exemple des EDO ou EDP, et simplement appliquer des methodes de resolution. Il n'y a rien a interpreter, rien a comprendre si tu n'en as pas envie. L'important c'est que l'outil que tu utilises soit adaptee a la situation.

En statistique il faut que l'outil soit adapte a la situation, que les donnees soient correctes, puis interpreter le tout dans les limites du test, et des donnees, et relier cela a la situation reelle. C'est tout autrement plus complexe.

Les statistiques ce n'est pas de la manipulation de chiffres, on peut faire dire tout et n'importe aux statistiques que sous la condition de ne pas etre statisticien (honnete). Donc oui, c'est un metier, de plus en plus necessaire avec la complexification des methodes et des donnes / modeles.

Probablement. Et après ? Et ce que ça vaut la peine de rejeter tout ce qu'ils font ? Bizarrement, j'ai l'impression que des gens qui "ne savent pas trop ce qu'ils font" s'en sortent quand même assez bien pour pondre des résultats cohérents, qui tiennent la route, et qui sont reproductible. Et ça empêche pas le monde de tourner.

Le fond du problème c'est : comment critiquer son travail correctement si on sait pas ce qu'on manipule ?

En plus, la théorie sur le papier, c'est très joli, mais dans le monde réel, ton doctorat en statistiques va se heurter à la complexité du monde réel, dans lequel le nombre de variables indépendantes à contrôler est quasiment aussi long que le nombre de décimales de pi. Et ça, c'est sans prendre en compte les expériences avec le vivant, qui rallonge la liste des dites variables d'au moins tout ça (donc certaines parfaitement incontrôlables). Du coup, si tu devais vraiment bosser convenablement, ça te prendrait un temps bête pour tester tout les facteurs (dont certains sont intestables), et ça te demanderait une puissance de calcul énorme pour faire après les fameux tests statistiques. Et là, heures de maths ou pas, tout le monde est capable de lancer un programme de statistique pour le faire.

Ça n'empêche pas d'être pragmatique (d'ailleurs personne n'a parlé d'un doctorat en stat ici). Mais avoir conscience de ce qu'on sait faire, ou pas, c'est AMHA une preuve d'honnêteté intellectuelle essentielle en sciences.

Comment faire sinon pour avoir un regard sur son activité ? Comment savoir répondre à des questions simples comme « comment ça marche ? qu'est-ce que je peux et comment interpréter mes résultats ? » ? On peut toujours se contenter de lire et relire le même livre de cuisine transmis entre générations, mais on sacrifie beaucoup (trop) au passage.

+0 -0

Ne me faites pas dire ce que je n'ai pas dit: n'importe qui ne peut pas faire n'importe quoi avec des données, et c'est tout le but d'un cours de stat, normalement. Je suis tout à fait d'accord pour dire qu'il y a des gens qui font n'importe quoi et qui sont tout de même publié, c'est comme ça partout. Le cours de stat est aussi censé te donner des outils pour écarter une publication qui fait n'importe quoi avec ces données, justement. Sinon, je vois pas bien à quoi ça sert.

Encore une fois, je me répète, c'est pas ça qui me dérange, mais des phrases en mode argument d'autorité du type

En revanche, je suis toujours un peu sceptique quand on me dit qu'on peut comprendre ce qui est fait en stat sans avoir la moindre idée de ce qu'il se passe mathématiquement […]

(et ce nombre complètement affolant de 36 crédits de mathématiques pour prétendre savoir faire des stats convenablement, qui en plus d'être un peu sorti d'un chapeau est un peu irréalisable dans un cursus scientifique normal)

Ce que je comprend, et désolé de le dire comme ça, c'est "entre prendre un cours de stat ou rien, ben t'aurais mieux fait de rien faire". Et ça, non, je suis désolé, mais je peux pas laisser passer. J'entend bien que c'est un métier à part entière et que ça demande certaines connaissances, et c'est tout à fait normal, tout comme (et promis j'arrête avec les métaphores après ça) il y a des conducteurs de voiture et des constructeurs de voitures. Je dénigre aucunement les gens dont c'est le métier, et je leur souhaite d'ailleurs bien du courage, mais ça sert à rien de dire "arrête, de toute façon t'y comprend rien".

@Holosmos:

Mais avoir conscience de ce qu'on sait faire, ou pas, c'est AMHA une preuve d'honnêteté intellectuelle essentielle en sciences.

Tu crois vraiment que quand je fais quelque chose je le fais sans me poser des questions ? Évidement qu'il faut s'en poser ! Évidement qu'il faut douter, vérifier, recommencer ! Évidement qu'il faut aller demander l'avis d'autres personnes (c'est le principe du peer-reviewing quand il est bien fait). C'est peut être ta manière d'écrire qui rend comme ça, mais j'ai sincèrement l'impression que tu me prend de haut quand je lis ça.

Et quand tu dit,

Le fond du problème c'est : comment critiquer son travail correctement si on sait pas ce qu'on manipule ?

Le "on" (le deuxième) n'a absolument pas la même définition pour toi que pour moi. L'autre problème, c'est que tu ne défini jamais (et j'insiste, jamais, ce n'est pas la première fois) ce "on", et que j'en déduit que c'est "les maths en général", d'où le fait qu'on ne sois probablement pas d'accord sur la définition. Pour prendre un exemple, je me fout complètement (pas par dédain, mais par manque de temps teinté d'un peu de désintérêt) de connaitre la nature profonde de ce que sont les maths (ZFC, toussa). Encore une fois, il y a des gens dont c'est le métier, et tant mieux pour eux, et je ne critique pas. Mais encore une fois, je revient à cette notion "d'outil mathématique" qui n'as définitivement pas l'air de passer : les mathématiques sont un outil pour moi, et j'en connais ce qu'il me semble être nécessaire d'en connaitre.

Et comme tu t'en sort à chaque fois par des phrases du type "oui mais tu sais pas ce que tu fais" sans jamais prendre la peine d'expliquer pourquoi (dixit , par exemple), ben on en sortira jamais.


d'ailleurs personne n'a parlé d'un doctorat en stat ici

C'est bien entendu une hyperbole, ou bien j'aurais pas enchaîné sur les décimales de pi :p

Encore une fois, je me répète, c'est pas ça qui me dérange, mais des phrases en mode argument d'autorité du type

J'ai juste dit que j'étais sceptique. Pas que je condamnais ou pissais dessus à tout va :0.

et ce nombre complètement affolant de 36 crédits de mathématiques pour prétendre savoir faire des stats convenablement, qui en plus d'être un peu sorti d'un chapeau est un peu irréalisable dans un cursus scientifique normal

C'est pas si affolant à l'ENS. Pour te donner une idée, l'an dernier j'ai validé 124 ECTS. (Oui, en un an)

Ce que je comprend, et désolé de le dire comme ça, c'est "entre prendre un cours de stat ou rien, ben t'aurais mieux fait de rien faire".

C'est dommage de faire une citation qui n'est nulle part. J'ai pas dit qu'il fallait bannir toute activité sans connaissance mathématique sérieuse. J'ai dit que c'était un plus qui me semblait indispensable pour pas faire de connerie.

Après ceux qui veulent faire sans, ou avec un peu, je suis sceptique. Ce qui veut pas dire que je suis en train de les insulter. Il s'agit là du scepticisme "classique" du scientifique.

Tu crois vraiment que quand je fais quelque chose je le fais sans me poser des questions ? Évidement qu'il faut s'en poser ! Évidement qu'il faut douter, vérifier, recommencer ! Évidement qu'il faut aller demander l'avis d'autres personnes (c'est le principe du peer-reviewing quand il est bien fait). C'est peut être ta manière d'écrire qui rend comme ça, mais j'ai sincèrement l'impression que tu me prend de haut quand je lis ça.

Sincèrement, non, je te prends pas de haut et je ne le ferai pas. Je te donne mon avis, qui peut être mauvais, il est ce qu'il est.

Pour prendre un exemple, je me fout complètement (pas par dédain, mais par manque de temps teinté d'un peu de désintérêt) de connaitre la nature profonde de ce que sont les maths (ZFC, toussa). Encore une fois, il y a des gens dont c'est le métier, et tant mieux pour eux, et je ne critique pas. Mais encore une fois, je revient à cette notion "d'outil mathématique" qui n'as définitivement pas l'air de passer : les mathématiques sont un outil pour moi, et j'en connais ce qu'il me semble être nécessaire d'en connaitre.

Il s'agit pas de ZFC ici. Mais, par exemple, avoir les connaissances mathématiques en statistique, pourquoi pas ?

Tu considères que les maths ne sont qu'un outil, alors qu'à mes yeux c'est l'articulation même des sciences d'aujourd'hui. Et ça va plus loin que de savoir de quoi est fait le béton pour l'utiliser.


Après tu m'as toujours pas répondu. Je suis vraiment curieux, avec toute la bonne foi possible, sur le contenu du cours de stat que tu as eu. Parce que je ne sais pas ce que tu sais (normal). Donc est-ce que tu pourrais développer ? Et nous dire ce qui te sembles vraiment utile à connaître.

Parce que quand je lis :

Tu crois vraiment que quand je fais quelque chose je le fais sans me poser des questions ? Évidement qu'il faut s'en poser ! Évidement qu'il faut douter, vérifier, recommencer !

Je suis persuadé qu'on a le même avis in fine.

Je suis vraiment curieux, avec toute la bonne foi possible, sur le contenu du cours de stat que tu as eu.

Pour ma part, j'ai eu la spécificité d'un double cursus jusqu'en licence, donc de vraies proba, avec les tribus, les différents types de convergences, tout le tintouin de Markov et Bienaymé-Tchébychev, et plusieurs versions du théorème central limite (demandez pas trop de détail, ça date un peu tout ça…).

Ensuite, en master de physique, il était acquis de la part des mes camarades les questions de variables aléatoires discrètes et continues, les lois courantes (Poisson, normal, khi-2…), le théorème central limite dans sa version simple. Les questions des différents type de convergences étaient rapidement abordées. Mais ce n'était pas du tout un master de physique orienté traitement de donnés.
On a eu aussi une (mauvaise) introduction aux méthodes du maximum de vraisemblance (typiquement, la première moitié du tome 2 du Kalbfleisch, si ça te parle) – mais malheureusement, le cours était très mal faits, et je n'en retiens pas grand chose.

+0 -0

Wesh les gens,

Je profite de ce sujet pour signaler qu'une galaxie, appelée Dragonfly44, a été trouvée à 330 millions d'années lumière de nous. Si cette galaxie a sensiblement la même masse que la nôtre, elle a ceci de particulier qu'elle est composée à 99,99% de matière noire, ce qui est largement plus que n'importe quelle galaxie connue.

Lien sur lequel j'ai lu l'info : http://www.gurumed.org/2016/08/27/une-galaxie-aussi-grande-que-la-ntre-et-compose-9999-de-matire-noire/

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte