Les sauvegardes de Zeste de Savoir

J’ai dans mon appart un petit serveur tournant sous FreeBSD, me servant notamment de routeur et de NAS. J’ai 8 To de stockage dessus en RAID¹, et me sert depuis peu de ce serveur comme espace de sauvegarde pour la production de Zeste de Savoir.

Les données de Zeste de Savoir se trouvent à deux endroits en production. D’une part dans le dossier /opt/zds/data, contenant les dépôts git des contenus, les médias uploadés, et autres PDFs générés. D’autre part dans une base de donnée MySQL.

J’ai en réalité ~16 To de disques durs répartis sur 4 disques, qui sont en miroirs deux par deux. ↩

Sauvegarde de la base via Xtrabackup
rsync et snapshots ZFS
La cerise sur le gâteau: compression à la volée des volumes

Sauvegarde de la base via Xtrabackup

Auparavant, pour sauvegarder la base, mysqldump était utilisé pour générer un dump complet de la base sous forme de fichier sql. Ces dumps pèsent un peu moins de 500 Mo non-compressés, et 100 Mo gzippés. Aussi, chaque dump contient l’ensemble de la base de données, alors qu’en général entre deux sauvegardes, seul une partie de la base a changé.

Aussi, mysqldump a tendance à vouloir verrouiller les tables pendant le dump, et ainsi ralentir le site.

Mon objectif était d’effectuer des backups plus régulièrement, pour éviter des retours dans le passés trop importants en cas d’incident majeur. Les dumps étaient effectués une fois tous les jours, et je ne pouvais pas me permettre d’en faire un toutes les heures.

Xtrabackup est un outil développé par Percona permettant de faire des sauvegardes incrémentales et sans LOCK d’une base MySQL. Il se base sur le fait qu’InnoDB¹ maintient sur le disque un historique des transactions lui permettant de récupérer la base en cas d’incident majeur, tant que le disque est intacte. Il utilise donc directement les fichiers InnoDB sur le disque, plutôt que de récupérer toute la base via une connexion mysql au serveur de BDD.

Il offre donc

des sauvegardes sans lock des tables²
des sauvegardes incrémentales, puisqu’il lui suffit de sauvegarder les nouvelles entrées du journal de transactions d’InnoDB
une restauration beaucoup plus rapide, puisqu’il s’agit d’une simple copie de fichier, et non un énorme script SQL à exécuter

J’ai donc écrit un petit script permettant de faire des backups complètes et incrémentales. Les backups complètes sont effectuées une fois par jours, et les backups incrémentales toutes les heures.

#!/bin/sh

# Bonne pratique: arrêter le script si une commande retourne un code d'erreur autre que 0, 
# et si une variable non-existante est utilisée
set -eu

# L'endroit où sont stockées les sauvegardes
WD=/var/backups/mysql
# `latest` est un lien symbolique vers la dernière sauvegarde
LATEST=$WD/latest

# On récupère le nom complet de l'ancienne backup
PREVIOUS=`readlink -f $LATEST`
# La nouvelle backup aura comme nom AAMMJJ-HHSS
NEXT=$WD/`date '+%Y%m%d-%H%M'`

if [ -d "$NEXT" ]; then
    echo "\`$NEXT' already exists."
    exit 1
fi

if [ "$#" -ge 1 ] && [ "$1" = "full" ]; then
    # Les backups "full" ont en plus `-full` dans le nom
    NEXT=$NEXT-full
    xtrabackup --backup --target-dir=$NEXT 2> $NEXT.log
else
    if ! [ -L "$LATEST" ]; then
        echo "\`$LATEST' does not exists. Consider doing a full backup first."
        exit 1
    fi

    xtrabackup --backup --target-dir=$NEXT --incremental-basedir=$PREVIOUS 2> $NEXT.log
fi

# On supprime les anciens liens symboliques
rm -f $LATEST $LATEST.log

# Et on les recréé avec la sauvegarde fraîche
ln -s $NEXT $LATEST
ln -s $NEXT.log $LATEST.log

Plus qu’à exécuter ce script régulièrement le script via cron:

root@zdsprod1:~# crontab -l
# min hour dom month dow command
0 * * * * /var/backups/mysql/backup.sh
15 3 * * * /var/backups/mysql/backup.sh full

Et voilà le résultat !

root@zdsprod1:~# ls -l /var/backups/mysql
…
drwxr-x---  5 root root 4.0K Mar 10 02:00 20180310-0200
-rw-r--r--  1 root root  47K Mar 10 02:00 20180310-0200.log
drwxr-x---  5 root root 4.0K Mar 10 03:00 20180310-0300
-rw-r--r--  1 root root  47K Mar 10 03:00 20180310-0300.log
drwxr-x---  5 root root 4.0K Mar 10 03:15 20180310-0315-full
-rw-r--r--  1 root root  46K Mar 10 03:15 20180310-0315-full.log
drwxr-x---  5 root root 4.0K Mar 10 04:00 20180310-0400
-rw-r--r--  1 root root  46K Mar 10 04:00 20180310-0400.log
drwxr-x---  5 root root 4.0K Mar 10 05:00 20180310-0500
-rw-r--r--  1 root root  46K Mar 10 05:00 20180310-0500.log
…

À titre indicatif, une sauvegarde complète pèse 1.2 Go non-compressée, 200 Mo compressé, et une incrémentale pèse en moyenne 15 Mo.

Ces sauvegardes sont ensuite récupérées sur mon serveur toutes les heures via rsync:

1	rsync -avr zdsprod1:/var/backups/mysql/ /tupperware/backups/zestedesavoir/db

Histoire de pas exploser le stockage de la prod, j’ai écrit un petit script pour garder que les deux dernières backups complètes (+ les incrémentales entre). Les anciennes sauvegardes restent bien sûr sur mon serveur.

#!/bin/sh

set -eu

WD=/var/backups/mysql

BACKUPS="`echo $WD/*-*/ | tr ' ' '\n' | sort -nr`"

TO_DELETE="`
    echo "$BACKUPS" | awk '
        BEGIN { full=0 }
        { if (full > 1) { print $0 } }
        /full/ { full++ }
    '
`"

[ -z "$TO_DELETE" ] || rm -r "$TO_DELETE"

Le moteur de stockage par défaut sur MySQL ↩
Je sais, mysqldump peut ne pas locker les tables, mais il lock quand même les transactions pendant la backup, ce qui "met en pause" toute opération pendant le dump. ↩

rsync et snapshots ZFS

J’ai donc mentionné plus tôt que j’utilise ZFS sur mon serveur comme système de fichier.

ZFS a été développé à l’origine par Oracle pour Solaris. Il a été ensuite porté notamment sur FreeBSD, et plus récemment sur Linux (via ZFSOnLinux).

ZFS a la particularité de faire à la fois gestionnaire de volumes logiques (comme LVM) & RAID (mdadm sur linux) et du système de fichier. Il permet de gérer un ensemble de disques durs comme un seul ensemble (éventuellement avec de la redondance pour être tolérant aux pannes), que l’on peut subdiviser en multiples sous-volumes (datasets, dans le jargon ZFS) avec différentes propriétés. On pourra donc attribuer différents droits aux utilisateurs en fonction du volume, limiter la taille maximum de chaque volume, et activer certaines fonctionnalités type compression et deduplication à la volée par volume.

ZFS permet également de faire des snapshots instantanément et sans coût d’un volume. Une snapshot ne va prendre comme place sur le disque que la différence entre la snapshot et le volume actif. Idéal donc, pour des backups.

spaetzle/root ~ > zfs list -t snap
NAME                                                  USED  AVAIL  REFER  MOUNTPOINT
…
tupperware/backups/zestedesavoir/data@20180310-1602   412K      -  5.56G  -
tupperware/backups/zestedesavoir/data@20180310-1702   884K      -  5.56G  -
tupperware/backups/zestedesavoir/data@20180310-1802   876K      -  5.56G  -
tupperware/backups/zestedesavoir/data@20180310-1902   844K      -  5.57G  -
tupperware/backups/zestedesavoir/data@20180310-2303      0      -  5.57G  -
tupperware/backups/zestedesavoir/data@20180311-0002      0      -  5.57G  -
tupperware/backups/zestedesavoir/data@20180311-0102      0      -  5.57G  -
…

Les snapshots sont donc très légères, avec en général moins d’1 Mo par snapshot.

Le script pour synchroniser le dossier /opt/zds/data et les backups de la base, et faire la snapshot est relativement simple:

#!/bin/sh

BASE=tupperware/backups/zestedesavoir

echo "Syncing data"
rsync -azvr --delete zdsprod1.zestedesavoir.com:/opt/zds/data/ /$BASE/data
echo "Creating snapshot"
zfs snapshot $BASE/data@`date '+%Y%m%d-%H%M'`
echo "Syncing database"
rsync -azvr zdsprod1.zestedesavoir.com:/var/backups/mysql/ /$BASE/db

Ce script est lancé 1 fois par heure, 2 min après la backup incrémentale de la base.

La cerise sur le gâteau: compression à la volée des volumes

ZFS permet de compresser des volumes entiers de manière transparente.

spaetzle/root ~ > zfs get used,compressratio,compression,logicalused tupperware/backups/zestedesavoir/{db,data}
NAME                                   PROPERTY       VALUE     SOURCE
tupperware/backups/zestedesavoir/data  used           5.57G     -
tupperware/backups/zestedesavoir/data  compressratio  1.17x     -
tupperware/backups/zestedesavoir/data  compression    lz4       local
tupperware/backups/zestedesavoir/data  logicalused    5.89G     -
tupperware/backups/zestedesavoir/db    used           666M      -
tupperware/backups/zestedesavoir/db    compressratio  3.11x     -
tupperware/backups/zestedesavoir/db    compression    lz4       local
tupperware/backups/zestedesavoir/db    logicalused    1.88G     -

Ainsi, si les backups de la base semblent peser près de 2 Go, sur le disque ils ne prennent que 700 Mo.

Ça fait partie des fonctionnalités qui rendent ZFS awesome. Sachez que je n’ai couvert ici qu’une petite partie des fonctionnalités de ZFS.

Conclusion, j’aime ZFS.

À plus ou moins long terme j’aimerais mettre en place un autre serveur à un autre endroit, pour notamment avoir de la redondance à deux endroits physiques distincts sur mes backups. Oh, est-ce que j’ai mentionné que ZFS permet d’envoyer et recevoir des datasets entiers ou incrémentalement via de simples pipes ?

Et les backups de ZdS sont à nouveau un peu plus sérieuse, et on devrait pouvoir réagir plus rapidement en cas d’incident.

15 commentaires

lthms, dimanche 11 mars 2018 à 09h59

Merci pour ce billet, son contenu était très intéressant.

11/03/18 à 09h59

I don’t like syntax highlighting.

+2 -0

unidan, dimanche 11 mars 2018 à 12h43
Modifié

Merci pour le billet !

Par contre il manque des quotes autour de tes chemins pour etre correct ! Sinon tu auras des soucis dès qu’il y aura une espace !

11/03/18 à 12h43
Modifié

+0 -0

Sandhose, dimanche 11 mars 2018 à 13h24

Par contre il manque des quotes autour de tes chemins pour etre correct ! Sinon tu auras des soucis dès qu’il y aura un espace !

unidan

En théorie y’a pas de raison que j’ai d’espace dans les noms de dossiers. :-°

Mais bien vu, je vais changer ça.

11/03/18 à 13h24

"I also don’t trust Caribou anymore." —  Joss Whedon

+0 -0

lthms, dimanche 11 mars 2018 à 16h07

En théorie y’a pas de raison que j’ai d’espace dans les noms de dossiers.

Famous last words?

11/03/18 à 16h07

I don’t like syntax highlighting.

+0 -0

unidan, dimanche 11 mars 2018 à 19h11

Surtout si tu partages le script, ça évite les comportements à la Steam

11/03/18 à 19h11

+0 -0

Taurre, dimanche 11 mars 2018 à 19h41

Merci pour ce billet très intéressant, je ne connaissais pas le logiciel Xtrabackup, mais je vais me pencher dessus, du coup.

Je faisais de mon côté déjà des sauvegardes incrémentales à l’aide de mysqldump et de l’activation des binary logs (la procédure est détaillée ici), mais Xtrabackup à l’air plus simple d’emploi aussi bien pour sauvegarder que pour charger les données.

11/03/18 à 19h41

#JeSuisArius

+0 -0

SpaceFox, lundi 12 mars 2018 à 00h13

une restauration beaucoup plus rapide, puisqu’il s’agit d’une simple copie de fichier, et non un énorme script SQL à exécuter

Ça m’étonne un peu, MySQL/InnoDB a la réputation ne ne pas supporter la sauvegarde/restauration par copie de fichiers. C’est maintenant le cas ?

Par curiosité, tu as essayé de restaurer une sauvegarde (genre, la dernière et une vieille) ? Il y a des points d’attention sur cette procédure ?

12/03/18 à 00h13

Les textes de SpaceFox & Lisa Refur – Un Renard en Corée – Un renard au Japon – @spacefox@mastodon.spacefox.fr

+1 -0

Sandhose, lundi 12 mars 2018 à 09h36
Modifié

une restauration beaucoup plus rapide, puisqu’il s’agit d’une simple copie de fichier, et non un énorme script SQL à exécuter

Ça m’étonne un peu, MySQL/InnoDB a la réputation ne ne pas supporter la sauvegarde/restauration par copie de fichiers. C’est maintenant le cas ?

Effectivement, c’est pas tout à fait clair. En fait, il se base sur le mécanisme de récupération d’InnoDB. En cas de crash, MariaDB est capable de récupérer l’état de la base grâce aux fichiers de logs binaires présents sur le disque.

XtraBackup va demander le verrouillage de ces logs (LOCK BINLOG FOR BACKUP), copier les fichiers, et lancer ce mécanisme de récupération d’InnoDB.

cf. https://www.percona.com/doc/percona-xtrabackup/LATEST/how_xtrabackup_works.html

Par curiosité, tu as essayé de restaurer une sauvegarde (genre, la dernière et une vieille) ? Il y a des points d’attention sur cette procédure ?

SpaceFox

Sur une backup full en local¹, ouais. J’ai prévu d’écrire un script pour gérer les backups incrémentales, puisqu’il faut appliquer unes par unes les backups incrémentales par dessus la backup full (ce qui demande un peu d’automatisation si on veut pas se taper potentiellement 24 backups incrémentales à appliquer à la main).

J’aimerais aussi utiliser ces backups pour synchroniser la beta, aussi.

sur le serveur de sauvegarde ↩

12/03/18 à 09h36
Modifié

"I also don’t trust Caribou anymore." —  Joss Whedon

+2 -0

WinXaito, lundi 12 mars 2018 à 16h49

Juste un petit truc qui m’intrigue, tu es le seul à faire des backup ? En cas de problème sur ZDS, qu’arriverait t’il si tu n’es pas joignable/problème de sauvegarde/etc. ?

Le système ne pourrait t’il pas être utilisée avec le Cloud storage archives de OVH (qui est relativement peu chère) ?

12/03/18 à 16h49

+0 -0

Sandhose, lundi 12 mars 2018 à 19h59

Juste un petit truc qui m’intrigue, tu es le seul à faire des backup ? En cas de problème sur ZDS, qu’arriverait t’il si tu n’es pas joignable/problème de sauvegarde/etc. ?

Le système ne pourrait t’il pas être utilisée avec le Cloud storage archives de OVH (qui est relativement peu chère) ?

WinXaito

Si vraiment, on a des snapshots Gandi du disque régulièrement¹, qui sont elles accessibles à un certain nombre de personnes dans l’équipe technique.

Combiné au fait qu’on garde 2j de backups incrémentales de la DB sur le disque du serveur, je pense qu’on est pas trop mal.

3 snapshots par jour, fait toutes les 6 heures (6h, 12h,et 18h). 6 snapshots des 6 derniers jours, fait toutes les semaines (24h, 48h, 72h, 96h, 120h, et 144h - 6 jours). 2 snapshots des deux derniers mois, fait toutes les 28 jours. ↩

12/03/18 à 19h59

"I also don’t trust Caribou anymore." —  Joss Whedon

+0 -0

anonyme, lundi 12 mars 2018 à 21h30
Modifié

:magicien: 1, 2, 3… So… Sauvegarde !

Je ne comprends pas trop la différence/interaction entre MySQL et innoDB.

Tout ce qui est de l’interprétation du langage SQL c’est le SGBDR donc MySQL puis ce qui gère des données c’est le moteur innoDB?

12/03/18 à 21h30
Modifié

+0 -0

Sandhose, mercredi 14 mars 2018 à 10h48

Tout ce qui est de l’interprétation du langage SQL c’est le SGBDR donc MySQL puis ce qui gère des données c’est le moteur innoDB?

A-312

De ce que je sais, ouais. MySQL peut fonctionner avec différents moteurs de stockages, qui vont du coup s’occuper de stocker sur le disque les données. Pendant très longtemps celui par défaut c’était MyISAM, et depuis la 5.6 par défaut c’est InnoDB. Mais il en existe d’autres, cf. https://dev.mysql.com/doc/en/storage-engines.html

14/03/18 à 10h48

"I also don’t trust Caribou anymore." —  Joss Whedon

+0 -0

SpaceFox, mercredi 14 mars 2018 à 11h12

Je rajoute que dans la vraie vie depuis une bonne dizaine d’années, il faut toujours utiliser InnoDB sauf si on a une excellente raison de faire autrement.

14/03/18 à 11h12

Les textes de SpaceFox & Lisa Refur – Un Renard en Corée – Un renard au Japon – @spacefox@mastodon.spacefox.fr

+4 -0

Eragon, mercredi 09 mai 2018 à 12h23

Mais si on utilise pas MySQL c’est une raison de na pas utiliser InnoDB.

09/05/18 à 12h23

+0 -0

ZFS ftw

Sauvegarde de la base via Xtrabackup

rsync et snapshots ZFS

La cerise sur le gâteau: compression à la volée des volumes

15 commentaires

Pas encore membre ?