Do not use requirements.txt

Cette semaine je tombais sur cet article en anglais nommé « Do not use requirements.txt » à propos du packaging en Python, qui donne deux conseils :

Ne pas utiliser pip et les fichiers requirements.txt pour gérer les dépendances Python.
Utiliser Poetry à la place.

Intrigué par le titre et ces conseils, je continuais ma lecture mais n’allais pas plus être convaincu.

Le packaging en Python
Ne pas confondre packaging et déploiement
Et les environnements virtuels dans tout ça ?

Le packaging en Python

L’article commence par expliquer que « la manière traditionnelle de gérer les dépendances pour un projet Python était de les lister dans un fichier requirements.txt et d’utiliser pip install -r requirements.txt pour les installer » puis se base là-dessus pour continuer son argumentaire.

Mais ce n’est pas ainsi que fonctionne le packaging en Python.

Un projet Python définit normalement un fichier pyproject.toml¹ qui comporte toutes les métadonnées liées à ce projet (nom du projet, version, auteurs, et même des configurations pour des outils) ainsi que les dépendances nécessaires à son bon fonctionnement.

Ces dépendances sont des noms de paquets Python accompagnés de spécificateurs de versions pour préciser un intervalle de versions compatibles.

[project]
name = "zds-site"
version = "30.5.0"
dependencies = [
    "Django>3.0",
    "requests==2"
]
requires-python = ">=3.8"
authors = [
  {name = "Clémentine Sanpépins", email = "clem@zestedesavoir.com"},
]
description = "Zeste de Savoir"

[project.urls]
Homepage = "https://zestedesavoir.com/"
Repository = "https://github.com/zestedesavoir/zds-site"

Exemple simplifié de fichier pyproject.toml

Tout ce beau monde s’installe ensuite avec pip. pip est l’outil standard pour installer des dépendances en Python et même s’il n’est pas le seul, il reste la référence sur la question. Il repose sur les dépôts PyPI (Python package Index) où sont publiés la majorité des projets Python.
Il suffit par exemple d’un pip install Django pour installer le framework Django ainsi que ses dépendances.

Dans le cas d’un projet en cours de développement on va chercher à l’installer depuis les sources locales plutôt qu’un paquet distant (puisque la version en train d’être développée n’existe pas encore sur le dépôt) et pip gère pour cela les chemins locaux.
Ainsi, pip install .² depuis le répertoire du projet analysera le fichier pyproject.toml pour installer le projet décrit ainsi que ses dépendances.

Il n’est donc nulle question ici d’un fichier requirements.txt pour lister les dépendances du projet. Ce fichier peut exister et a son utilisé, mais j’y reviendrai plus tard.

On note d’ailleurs que Poetry, préconisé dans l’article que je cite, fonctionne sur le même mode (métadonnées et dépendances listées dans le fichier pyproject.toml) même s’il a son propre format pour les exprimer et ses propres outils pour installer le projet ensuite (en remplacement de pip donc).

Anciennement on pouvait aussi trouver des fichiers setup.cfg et/ou setup.py.↩
On utilisera plutôt la syntaxe pip install -e .. Cette option -e signifie « éditable » et indique de ne pas copier les sources du projet pour construire le paquet mais d’utiliser un lien symbolique afin que les modifications locales se répercutent sur la version installée.↩

Ne pas confondre packaging et déploiement

Je pense que mon désaccord avec l’article vient de la différence entre packaging et déploiement.

Je détaillais le packaging dans la section précédente : il s’agit de décrire le projet et les versions de dépendances avec lesquelles il est compatible. L’idée étant qu’un projet puisse être installé à différents endroits avec des versions différentes (il peut exister plusieurs instances d’un même projet). Et suivant l’endroit, le système d’exploitation ou les bibliothèques système installées, toutes les dépendances ne seront pas disponibles dans les mêmes versions. On veut donc faire en sorte que le panel de dépendances avec lesquelles le projet est compatible soit le plus large possible.

Mais dans le cas d’un déploiement, pour la mise en ligne d’un projet, on veut assurer un environnement cohérent et reproductible. Pour cela il nous faut des versions précises des dépendances installées, afin de pouvoir installer exactement les mêmes versions dans des endroits différents :

Si deux serveurs peuvent répondre aux requêtes pour un même site web, on veut qu’ils utilisent la même version du projet.
Dans mon environnement local, je veux pouvoir débuguer le projet identique à celui déployé en production.

On remarque donc des objectifs contradictoires entre packaging et déploiement : dans le premier cas on veut spécifier les versions de dépendances les plus larges possibles et dans l’autre on veut être le plus restreint/précis possible.

Et c’est pour répondre à cette problématique de déploiement qu’interviennent les lock files. Ce sont des fichiers générés qui précisent (verrouillent) les dépendances (directes et indirectes) du projet dans un environnement donné. Un fichier requirements.txt peut remplir ce rôle.

Ce fichier est en fait une liste de dépendances dans une syntaxe comprise par pip.

asgiref==3.7.2
Django==5.0.2
requests==2.0.0
sqlparse==0.4.4

Exemple de fichier requirements.txt

Chaque ligne du fichier est un argument valide à placer derrière un pip install.
Et c’est d’ailleurs ce que fait pip install -r requirements.txt : il analyse le contenu du fichier et traite chaque ligne comme s’il s’agissait d’un argument supplémentaire.¹

Le fichier requirements.txt que je montre en exemple est généré par la commande pip freeze après avoir installé le projet d’exemple. Cette commande liste tous les paquets Python installés avec leurs versions. On y trouve ainsi Django et requests qui sont des dépendances directes de mon projet, mais aussi asgiref et sqlparse qui sont des dépendances de Django.

Précédemment, mon pip install . a donc résolu les dépendances du projet pour récupérer les versions les plus à jour répondant aux critères et les a installées. Ce sont ces versions qui sont listées ici.

La génération d’un tel fichier peut aussi se faire à l’aide de l’outil pip-compile issu de la suite pip-tools qui prend le fichier pyproject.toml en entrée et résout les versions des dépendances sans nécessiter de les installer.

Si je dispose de différents environnements qui font tourner le projet dans des conditions / versions différentes, je peux avoir des lock files différents. Par exemple requirements_dev.txt et requirements_prod.txt.

La confusion entre packaging et déploiement vient notamment du fait que beaucoup de projets (particulièrement les projets SaaS) n’existent qu’en une seule instance : le projet n’est pas distribué à l’extérieur de l’entreprise et celui-ci est toujours déployé dans des environnements similaires.

Ainsi il n’est pas nécessaire de spécifier des versions de dépendances larges (personne d’autre n’installera le projet) et les deux besoins convergent.

Il n’empêche qu’il s’agit de problématiques différentes et cela explique que l’outillage soit différent.

On notera enfin que le format du fichier requirements.txt n’est pas forcément optimal pour remplir le rôle de lock file (d’autres formats stockent une somme cryptographique du paquet et d’autres attributs).

Des discussions sont en cours pour convenir d’un format standard en Python pour cet usage.

Le fichier pourrait ainsi contenir -r other_requirements.txt pour inclure un second fichier de dépendances.↩

Et les environnements virtuels dans tout ça ?

Le second point abordé par l’article cité concerne les environnements virtuels. Il s’agit d’un mécanisme de Python pour le « tromper » (via des variables d’environnement) en configurant des répertoires d’installation différents des répertoires systèmes pour les paquets. Ce qui permet de faire coexister sur la machine des versions différentes de même paquets dans des environnements différents.
L’outil standard pour gérer cela est venv (fourni avec Python), qui s’utilise via python -m venv.

La critique émise étant que pip ne crée pas automatiquement d’environnements virtuels pour installer les paquets.

Pourtant, est-ce vraiment souhaitable ?

Oui, dans le développement, un environnement virtuel sera nécessaire pour installer le projet. Il est d’ailleurs probable qu’un pip install exécuté en dehors d’un tel environnement lève une erreur (afin de ne pas mettre le bazar avec les paquets Python installés au niveau système).

Pour le déploiement c’est moins sûr : si on a le contrôle sur le système, sur les versions utilisées, et qu’on ne risque pas de conflit : on peut se passer d’un environnement virtuel.

Mais ensuite, est-ce qu’un environnement virtuel est suffisant ? On en revient au cas précédent des versions multiples.
Quand on travaille sur des versions différentes d’un projet / de ses dépendances, on aura besoin d’un environnement virtuel par ensemble de versions, pour pouvoir passer de l’un à l’autre sans tout réinstaller à chaque fois. D’autant plus si on travaille aussi avec des versions de Python différentes.

Alors à la question de savoir si c’est au gestionnaire de paquets (pip) de gérer les environnements virtuels, j’ai envie de répondre que non. Python s’inscrit plutôt dans la philosophie Unix d’avoir un outil qui fait une chose et qui la fait bien.

Alors bon, les fichiers requirements.txt : pourquoi pas ?

En l’absence d’un standard de lock file ils remplissent en tout cas bien ce rôle et sont assez lisibles. En plus ils sont faciles à gérer pour faire coexister plusieurs versions / environnements d’un projet.

Icône: Logo du projet PyPI sous licence GPL

5 commentaires

Ge0, samedi 02 mars 2024 à 14h51

Merci pour ce billet.

Je me suis mis à utiliser pdm pour le peu de (nouveaux) projets python que je maintiens.

Et Heroku (un PaaS comme un autre) requiert la présence d’un fichier requirements.txt dans ton projet, au moins sur les versions des stacks que j’utilise.

Alors la question elle est vite répondue.

02/03/24 à 14h51

Ge0

+0 -0

nohar, samedi 09 mars 2024 à 00h50
Modifié

Très sincèrement je me range de ton avis, si l’écosystème Python a, comme tous les autres, des éléments où on pourrait faire beaucoup mieux, à aucun moment je ne penserais à l’utilisation de fichiers requirements.txt comme un truc à changer, en tout cas pas de façon prioritaire.

Il y aura toujours besoin d’un tel fichier pour versionner les dépendances. Dans mon référentiel (celui de quelqu’un qui est passé à Go), ce qui impacte réellement l’expérience des développeurs, c’est peut-être que l’édition de ce fichier soit purement manuelle, et pas automatisée/pilotée par la toolchain standard du langage (ce qui veut dire notamment qu’il n’y a pas de moyen trivial de détecter les updates sur les dépendances pour rester à jour, sans se taper une vérif manuelle, régulière et laborieuse), mais structurellement ce fichier remplit un rôle vital et incompressible.

09/03/24 à 00h50
Modifié

I was a llama before it was cool

+1 -0

Ge0, samedi 16 mars 2024 à 10h42

Question pour @entwanne : est-ce que dans ton fichier requirements.txt tu inclus les hashes de tes dépendances ou pas ?

16/03/24 à 10h42

Ge0

+0 -0

entwanne, dimanche 17 mars 2024 à 07h38

J’en utilise peu de mon propre chef : au boulot on utilise d’autres solutions (avec leur propre format de lock file) et pour mes projets perso je ne suis pas confronté aux problématiques de déploiement.

Mais quand il m’arrive d’en écrire / générer, non, je n’inclus pas de hash, seulement des numéros de version précis. Je ne crois pas que ce format soit fait pour ça et c’est d’ailleurs l’objet de la future PEP sur le format de lock file standard.

17/03/24 à 07h38

entwanne — @entwanne — Un zeste de Python — La POO en Python — Notions de Python avancées — Les secrets d’un code pythonique

+0 -0

Ge0, samedi 27 avril 2024 à 13h50

C’est encore moi.

Au cas où cela serve une âme égarée : comment générer un fichier requirements.txt sans les hashes (à vos risques et périls, j’ai un besoin précis qui le justifie et que je ne détaillerai pas ici) :

pdm export --without-hashes > requirements.txt

Ceci jusqu’à ce que Heroku prenne des mesures pour ne pas forcer ses projets python à posséder le fichier requirements.txt.

Mais mon avis ne change pas : qu’on en eût besoin ou pas, je m’adapte…

À bientôt.

27/04/24 à 13h50

Ge0

+0 -0

Et pourquoi pas ?

Le packaging en Python

Ne pas confondre packaging et déploiement

Et les environnements virtuels dans tout ça ?

5 commentaires

Pas encore membre ?