[Les chroniques du libre] Le Mozilla Science Lab

Dans ce deuxième article, nous allons parler d'open science

Tout le monde connait Mozilla grâce à Firefox mais les projets de l'organisation ne se limitent pas à un navigateur. La mission de Mozilla est de promouvoir l’ouverture, l’innovation et la bonne santé du Web. La Fondation Mozilla propose des programmes pour mapper ces valeurs à la science, les médias, à la politique ou l'éducation afin de les rendre ouverts, collaboratifs et partageables.

Dans ce deuxième article des Chroniques du Libre, nous allons donc parler d'open science et plus particulièrement d'un projet de la Fondation Mozilla relativement peu connu : Le Mozilla Science Lab.

Le Mozilla Science Lab

Comme vous le savez sans doute, Internet s'est beaucoup développé grâce aux chercheurs et aux travaux de recherche. Les scientifiques ont créé cet outil qui a considérablement changé nos habitudes. Mais les habitudes des scientifiques n'ont que très peu changé. Les travaux scientifiques sont encore basés sur des papiers dont le partage est un sujet souvent évoqué. C'est pour cette raison que le Mozilla Science Lab a vu le jour en 2013.

Ce projet est mené par Kaitlin Thaney qui défend depuis des années l'idée d'open science (qui a notamment eu un rôle dans le développement des sciences commons, travaillé au MIT, puis aidé à lancer le groupe Digital Science à Londres). Elle a été rejoint par Greg Wilson, fondateur du programme Software Carpentry, qui aide les chercheurs à développer leurs compétences en Informatique depuis 1998.

Le Mozilla Science Lab permet de mettre en relation les étudiants, les programmeurs, les graphistes et les chercheurs (5000 aujourd'hui en comptant ceux de Software Carpentry) autour du développement de projets scientifique open source. D'ailleurs, ils recherchent constamment des personnes pour enseigner ou mentorer des projets afin d'aider le Software Carpentry à organiser de petits groupes de travail dans plusieurs universités. De plus, la communauté organise aussi des Code Sprint, participe à des festivals et organise chaque mois des appels de la communauté.

En 2015, le MSL cherche à travailler autour de l'apprentissage et de l'engagement et lancera un programme de bourses afin d'aider les chercheurs en début de carrière. Il organisera aussi des évènements (workshop, code sprint), développera ses ressources et formera des partenariats avec d'autres groupes pour soutenir les régions telles que l'Australasie. Le Mozilla Science Lab cherche aujourd'hui à implanter cette façon de travailler et de la faire reconnaitre afin de pouvoir inciter plus de personnes à contribuer.

Projets

Dans cette seconde partie, nous allons parler de 3 projets du Mozilla Science Lab.

Pathogens

Pathogens. Image de Stefan Walkowski

L'objectif du projet est de rassembler et organiser les données génétiques accessibles au public afin de mieux comprendre les interactions entre les organismes dans des microbiomes. Récemment, des chercheurs ont découvert que certaines bactéries pouvaient tenir un journal de leurs précédentes infections en mémorisant certaines parties d'ADN des phages les attaquant dans leur propre génome (plus précisément dans le CRISPR). Ce "log d'attaque" permet à la bactérie d'identifier les phages qui les attaquent et fournit une voie pour l'évolution des interactions de ces organismes.

Ce projet vise à fournir des outils pour assembler et filtrer efficacement de grandes quantités de données. Le résultat idéal étant de réaliser un réseau d'interactions hôte-pathogène pouvant être facilement interrogé, permettant ainsi aux chercheurs de répondre à des questions sur l'évolution d'un microbiome.

Le projet contient environ 5 membres en ce moment. Le plus facile pour commencer à contribuer est soit de visiter la page du site ou le github. Le projet en cours est de produire une carte interactive pour montrer le lien entre les phages et les bactéries pour permettre aux chercheurs de regarder les connexions entre les organismes dans un environnement spécifique.

Diversibee

Diversibee

Jana Vamosi est professeur agrégé à l'Université de Calgary au Canada. Elle étudie comment la biodiversité fonctionne et le rôle que jouent certaines espèces dans le fonctionnement des écosystèmes.

La perte de la biodiversité est un problème depuis de nombreuses années. Malheureusement, beaucoup de personnes ignorent le rôle de ces espèces dans l'environnement (outre le fait qu'une espèce soit jolie, charismatique voir fascinante). Ce programme vise à résoudre ce problème et d'illustrer le concept de la diversité fonctionnelle.

Se basant sur des travaux précédents, nous savons aujourd'hui que les joueurs sont capables de trouver rapidement la solution optimale à un problème. Diversibee est un jeu basé sur une récente étude où les scientifiques ont montré que les myrtilles étaient plus grosses lorsqu'elles étaient pollinisées par plusieurs groupes d'abeilles. Chaque groupe ajoutant aux myrtilles une valeur de 311 \$ par acre (par exemple, si 2 groupes d'abeilles étaient recensés, les myrtilles avaient une valeur ajoutée de 311 \$ et de 622 \$ pour 3 groupes). Le problème étant que ces abeilles habitent dans des forêts. L'agriculteur possédant donc quelques hectares de forêt peut donc augmenter la valeur de ses myrtilles. Par contre, s'il déboise ses terres, il peut alors mettre plus de myrtilles pour être une entreprise lucrative. Le but du jeu est alors de trouver la configuration maximale, celle où la configuration de la forêt maximise le rendement des myrtilles ainsi que le maintien des populations d'abeilles.

Ce projet est actuellement développé par 3 personnes du Mozilla Science Lab, ainsi que 3 autres personnes via github. Si vous souhaitez contribuer, vous pouvez vous rendre sur le repository git ou la page du projet et de contacter Jana Vamosi si vous avez la moindre question. Toute idée pour développer le projet est le bienvenue. En ce moment, des développeurs JavaScript et des designers sont recherchés.

Trillian

Trillian

Pour continuer dans la lignée du premier CdS, parlons un peu d'espace. L'astronomie génère un nombre astronomique (sans mauvais jeu de mots) de données. Ces données peuvent être issues de télescopes, de missions spatiales ou de simulations (par exemple les données de WISE, SDSS, 2MASS, Spitzer, GALEX, etc.). Autant de sources d'informations qui peuvent servir pour de multiples projets. Malheureusement, aujourd'hui aucune institution ne peut héberger autant de données. Rechercher quelque chose dans le ciel entier est donc quasiment impossible. En effet, un chercheur est obligé de télécharger une petite partie de ces données, d'écrire un code pour en extraire la partie intéressante avant de pouvoir analyser les données. Trillian cherche à inverser cette méthode. C'est-à-dire que l'utilisateur n'aura qu'à fournir un modèle en entrée (c'est-à-dire décrire ce qu'il recherche. Par exemple se baser sur l'âge, la masse, la galaxie hôte, les coordonnées, etc.) de Trillian et le moteur de calcul appliquera le modèle à toutes les données possibles. Pour travailler sur autant de données, la base de données de Trillian est distribuée sur tous les espaces de stockage mis à la disposition par la communauté.

Pour le moment, 5 personnes travaillent activement sur le projet. Il existe de nombreuses manières de les rejoindre :

  • Aider dans le design de l'infrastructure de l'application ainsi que sa sécurité.
  • Héberger des données sur un espace de stockage libre.
  • Coder si vous maîtrisez Python, PostgreSQL ou Docker
  • etc

Les avantages de l'open science

On peut tout naturellement se demander pourquoi ces projets sont open source. Faire de l'open science demande d'avoir une certaine confiance dans les données fournies ainsi que dans les personnes contribuant au projet. Si le projet nécessite plusieurs groupes de travail, il y aura sans aucun doute un manque de normalisation des compétences. Mais une fois ces désavantages montrés, on peut enfin voir les bénéfices qu'apportent cette manière de penser. On peut aujourd'hui collecter, utiliser, analyser des données assez facilement. Si ces données n'avaient pas été accessibles, ces projets n'auraient pas vu le jour.

De plus, l'open science permet à des personnes de différents environnements de discuter et de rendre des projets possibles. Il s'agit d'une bonne occasion de rendre possible un projet porté par une personne n'ayant aucune connaissance en développement informatique. Et vice versa, une personne possédant des connaissances en développement informatique peut se servir de ses connaissances pour résoudre de véritables problèmes. Ce système peut vous proposer diverses compétences (ainsi que du matériel) que vous n'auriez pas pu avoir à votre disposition. S'appuyer sur les compétences de la communauté permet d'ouvrir le champ des possibles et de favoriser le dialogue dans différentes disciplines. Le Mozilla Science Lab est une bonne plateforme pour pouvoir lancer ce dialogue et permet de trouver des liens entre des domaines apparemment sans lien. L'open science accélère la communication et la collaboration, qui sont les clés de la recherche.

Enfin, le web peut permettre d'améliorer la façon dont la recherche se fait aujourd'hui (par exemple pour éliminer les goulots d'étranglement que représente la perte de temps apportée par la rétroingénierie d'une expérience, la perte financière causée par un manque de données, une mauvaise gestion et par les projets qui ont besoin de repartir de zéro).

Pour conclure cet article, je vous propose une citation d'Isaac Newton que m'a cité Madeleine Bonsma pour définir son point de vue de l'open science :

Si j'ai vu plus loin, c'est en montant sur les épaules de géants.

Pour aller plus loin


20 commentaires

Pour conclure cet article, je vous propose une citation d'Isaac Newton que m'a cité Madeleine Bonsma pour définir son point de vue de l'open science :

Si j'ai vu plus loin, c'est en montant sur les épaules de géant.

D'une, il y a un -s à « géants », de deux, Newton n'a fait que reprendre une citation de Bernard de Chartres, un philosophe français du XIIe siècle, le changement de formulation (avec l'histoire de voir plus loin) étant due à Blaise Pascal. :-°

Sinon l'article est bien. :)

+3 -0

Décidément, on en apprend tous les jours. :D Je suis toujours étonné de voir certains changements de formulation ("Des nains sur des épaules de géants").

+0 -0

Merci pour cet article assez intéressant. Ça me rappelle un article que j'avais lu dans Sciences et Vie où ils parlaient de chercheurs et d'ingénieurs américains qui créaient des machines agricoles écologiques et optimisés au maximum et qui mettaient tout les plans en open-source. Enfin, c'était un petit article bien sympa, bravo à toi AmarOK.

Merci pour l'article, j'ai découvert des trucs sympa.

L'ouverture du milieu scientifique est une problématique beaucoup plus centrale que ce que l'on pense. Alors que la théorie veut que les recherches scientifiques soient partagés pour permettre une meilleure compréhension et analyse critique des résultats, la réalité aujourd'hui est encore que quelques groupes font payer cher l’accès au contenu publié. Il y a un réel besoin d'ouverture dans ce milieu. Heureusement les choses commencent à bouger. Il y a aussi de vrais besoin pour permettre de rendre les travaux de recherche reproductible. Je ne compte plus le nombre d'algo que j'ai trouvé suffisamment incomplet pour que la promesse des auteurs soit invérifiable car impossible à reproduire en local. C'est assez paradoxal au vu des principes du monde académique. Les lignes commencent à bouger et ce genre de projet permet de tout faire avancer dans le bon sens \o/

Cet article tombe plutôt bien ! Car justement jeudi, les députés débattront de rendre oui ou non, les données médicales publiques (feuille de soin, hospitalisation, etc, etc, ..), pour un partage plus simple des données et faire avancer les recherches ! Ce qui rentre dans le cadre aussi, de l'ouverture du monde scientifique au niveau de la filière médicale !

Bon ici, ce n'est pas des résultats de recherches qui sont rendus publique, mais bon, je trouve que ça emboîte le pas, de ce que l'article présente.

Banni

L'ouverture du milieu scientifique est une problématique beaucoup plus centrale que ce que l'on pense. Alors que la théorie veut que les recherches scientifiques soient partagés pour permettre une meilleure compréhension et analyse critique des résultats, la réalité aujourd'hui est encore que quelques groupes font payer cher l’accès au contenu publié. Il y a un réel besoin d'ouverture dans ce milieu. Heureusement les choses commencent à bouger. Il y a aussi de vrais besoin pour permettre de rendre les travaux de recherche reproductible. Je ne compte plus le nombre d'algo que j'ai trouvé suffisamment incomplet pour que la promesse des auteurs soit invérifiable car impossible à reproduire en local. C'est assez paradoxal au vu des principes du monde académique. Les lignes commencent à bouger et ce genre de projet permet de tout faire avancer dans le bon sens \o/

Libéraliser la science? Open science? Très peu pour moi, je suis plutôt anarcho-primitiviste dans ce domaine, j'ai pas vraiment envie que mon petit voisin JeanJean de 12 ans se mette à collecter de l'ADN ou à élever des abeilles mutantes. Mieux vaut garder la science et les scientifiques sous clefs dans leurs labos avec des budgets en baisse.

Quand j'entends le mot ADN, je sors ma hache en silex.

+0 -4

Je ne penses pas que ton voisin de douze ans ait les moyens de se payer le matériel pour ce genre de chose. Par contre, pour des chercheurs, ça peut être super utile de gagner toutes ces données qui étaient jusque là payantes ou même inaccessibles. Et pour en revenir à ce que tu disait, je penses que quelqu'un qui n'y connais pas grand chose abandonnerait assez vite. Parce que pour manipuler de l'ADN, je penses qu'il faut quand même des connaissances importantes … Donc je penses que ce ne peut être que bénéfique.

Edit : le loup a dit ça de manière plus courte …

+1 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte