Django et performance • Tribune • Zeste de Savoir

Les frameworks tel que Django ont parfois la réputation de devenir assez lents quand ils sont utilisés sur des gros projets. En effet, Django est souvent utilisé pour tester rapidement des idées, cela est peut-être dû à sa philosophie "livré avec les piles". C’est aussi souvent un framework choisi par les fondateurs de start-ups pour livrer un prototype fonctionnel le plus rapidement possible.

Il arrive parfois qu’après quelques années du code "naïf" de la première heure soit toujours en production et reçoivent de plus en plus de charge chaque jour. À un moment une partie de ce code deviendra tellement lent que cela dégrade l’expérience des utilisateurs. Prenons par exemple le nombre d’objets enregistrés dans la base de données, il est probable que ce nombre grandisse rapidement lorsque votre projet se développe. Le code naïf du début n’aura probablement pas été pensé pour gérer des millions d’objets en base, et sera donc assez inefficient.

Dans cette série de billets nous verrons comment identifier et résoudre les problèmes de performances les plus courants avec Django. Commençons par voir comment mesurer et identifier les problèmes de performances. Dans cette série de billets nous nous baserons sur des applications utilisant Python / Django et une base de données SQL, certains exemples utiliseront Django REST Framework.

Observabilité

Observabilité

Avant de tacler un problème de performance la première étape de s’assurer d’avoir un monitoring correct. En effet, comment vérifier les résultats des modifications apportées si vous n’avez aucune idée de ce qui se passe en production en termes de performances. Dans le cas d’une application web on considère généralement la latence comme la métrique la plus importante quand il s’agit de performance. De ce fait pouvoir mesurer la latence moyenne, P75, P90, P95 et P99 semble être un bon point de départ. Dans certains cas plus poussés il pourra aussi être intéressant de mesurer le CPU, la RAM et le réseau utilisé par les serveurs, on entre alors plus dans le monitoring de l’infrastructure que de l’application. En effet une modification de code peut très bien rendre l’application plus rapide mais beaucoup plus gourmande en RAM, ce qui peut parfois causer des gros dégâts.

Il est aussi important de garder l’environnement de test aussi stable que possible lorsque l’on teste des changements de code dans le but d’améliorer la performance. En effet ne changer qu’un seul paramètre de l’expérience à la fois est une bonne pratique scientifique à utiliser ici. Par exemple veiller à ne pas changer les ressources du serveur ou le type de base de données entre plusieurs tests afin de garder les résultats comparables.

Le logo de DataDog

Pour être capable de monitorer les performances de votre application en production (ou dans n’importe quel environnement) on utilise un APM. Il en existe de différentes sorte sur le marché, une solution en SaaS a l’avantage d’être assez rapide à mettre en place et ne nécessite que très peu de modification sur votre code et votre infrastructure. En revanche beaucoup de données (parfois sensibles) sont passées à ces outils, ce qui peut être gênant dans certains contextes. Le but de cet article n’est pas de comparer l’ensemble des solutions disponibles. après avoir longuement utilisé Newrelic je suis passé depuis deux ans à Datadog, dont l’utilisation est à mon sens plus simple. L’installation se fait simplement en ajoutant un petit agent sur le serveur et en ajoutant un middleware dans votre configuration Django. Une fois que la solution de votre choix est installée, voici le genre d’information que vous devriez avoir :

La latence de votre application Django (avec de l’historique)
Les routes les plus utilisées dans l’application
Les routes les plus lentes dans l’application
Les routes pour lesquelles votre serveur a passé le plus de temps
Des traces / détails pour chaque route spécifique, les outils échantillonnent généralement un certain pourcentage. Cela est normal, mais veillez à avoir assez de matière pour pouvoir tirer des conclusions.

Il est important de comprendre que chaque métrique apporte des informations différentes. Par exemple si vous vous intéressez à la performance pour des raisons de coûts (payer moins de serveurs par exemple) alors la métrique "temps passé par le serveur" est probablement celle qui vous intéresse le plus. En revanche si vous essayez d’optimiser le taux de conversion de votre site vous allez probablement plus vous concentrer sur la performance des pages les plus critiques de votre site en termes de ventes.

Au plus vous creuserez dans l’APM au plus vous trouverez des détails intéressants sur comment se comporte votre application en production. Par exemple : est ce que le site est toujours aussi rapide quelle que soit la langue d’affichage (dans le cas d’un site en plusieurs langues) ? Est-ce que le site est plus rapide pour un utilisateur anonyme ou pour un utilisateur connecté ? En général la latence moyenne est un bon point de départ mais ne vous emmènera pas très loin en termes d’optimisation. Comme dirait mon frère : "Avec la tête dans le frigo et les pieds dans le four, en moyenne tout va bien"

Ce billet fait partie d’une série qui entrera en détails sur l’optimisation des performances web avec Django. Le but sera de compiler tous les billets dans un article. N’hésitez à réagir où à poser vos questions

5 commentaires

anonyme, samedi 01 février 2020 à 14h33

Dans certains cas plus poussés il pourra aussi être intéressant de mesurer le CPU, la RAM et le réseau utilisé par les serveurs,

Et l’utilisation disque ! Parfois les applications caches ne peuvent pas tout garder en mémoire et sont obligés de relire des informations.

01/02/20 à 14h33

+0 -0

nohar, samedi 01 février 2020 à 15h31

Dans certains cas plus poussés il pourra aussi être intéressant de mesurer le CPU, la RAM et le réseau utilisé par les serveurs,

Et l’utilisation disque ! Parfois les applications caches ne peuvent pas tout garder en mémoire et sont obligés de relire des informations.

A-312

À ce moment-là ce n’est plus un serveur Django que tu monitores, mais un tout autre serveur (memcached, redis…).

Cela dit, ça me semble carrément suspect comme comportement. Si ton cache commence à vouloir déborder sur le disque, c’est que tu as ignoré un problème que tu aurais dû détecter beaucoup plus tôt.

01/02/20 à 15h31

I was a llama before it was cool

+3 -0

SpaceFox, samedi 01 février 2020 à 19h09

Tout à fait d’accord avec nohar : si ton serveur applicatif commence à faire des I/O disque, c’est généralement très louche. Par contre elles sont intéressantes à monitorer sur les serveurs de données (SGBD, ou tout autre système de cache ou de gestion de données hors base), parce que là c’est effectivement souvent une limite du système.

01/02/20 à 19h09

Les textes de SpaceFox & Lisa Refur – Un Renard en Corée – Un renard au Japon – @spacefox@mastodon.spacefox.fr

+0 -0

Mysterri1, dimanche 02 février 2020 à 19h10

Une suite de billets qui s’annonce intéressante.
J’ai hâte de lire la suite.

Pour le reste, je ne sais pas à qui les billets (et le futur article) sont destinés, mais certaines notions mériteraient peut-être d’être explicitées (ou liées à une ressource externe, voire une note de bas de page), je pense notamment aux mesures P75, P90, P95 et P99, ou encore à la notion d’APM.

02/02/20 à 19h10

+3 -0

mic77, vendredi 21 février 2020 à 16h13

Effectivement. Jamais entendu P75 et autres, APM d’ailleus

21/02/20 à 16h13

+0 -0

Observabilité

5 commentaires

Pas encore membre ?