Tesselz : un langage pour générer des figures répétitives en SVG

J’ai eu envie de concevoir un langage dédié à la description de figures géométriques répétitives. C’est un projet à titre d’exercice, pour apprendre à concevoir un langage et un interpréteur (et avoir une excuse pour approfondir mon expérience avec Rust).

Ce billet présente le résultat de ce petit projet-jouet : Tesselz, un langage impératif interprété qui permet de construire des figures géométriques répétitives faites de polygones et générer un rendu SVG.

Démonstration
Description du langage
Implémentation
Post mortem

Démonstration

Voici deux exemples pour montrer à quoi ressemble le langage et ce qu’il génère.

Papier peint

k = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11};
i = mul(k, vector(50, 0));
j = mul(k, vector(0, 50));
vectors = add(i, j);
A = point(0, 0);
B = point(50, 0);
C = point(50, 50);
D = point(0, 50);
square = polygon({A, B, C, D});
angle = div(3.14, 3);
square_rot = rotate(square, angle, point(25, 25));
pattern = translate(square_rot, vectors);
pattern > "output.svg";

Squared circle

Des carrés arrangés en cercle révélant un jour en forme d'étoile. — *Squared circle*

k = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11};
A = point(0, 0);
B = point(50, 0);
C = point(50, 50);
D = point(0, 50);
square = polygon({A, B, C, D});
square_offset = translate(square, vector(550, 550));
angles = mul(div(6.28, 12), k);
pattern = rotate(square_offset, angles, point(500, 500));
pattern > "output.svg";

Description du langage

Le langage est volontairement simpliste. Il contient juste ce qu’il faut pour décrire des polygones et des transformations géométriques basiques et sortir un rendu SVG. La conception se fonde sur un plan muni d’un repère cartésien pour décrire les formes et transformations.

Instructions

Un programme est une séquence d'instructions terminées par des points-virgules. Il y a seulement deux types d’instructions :

Assignment : var = expr; évalue l’expression expr et associe l’identifiant var au résultat.
Render : expr > "out.svg"; évalue l’expression expr et écrit un fichier out.svg contenant le rendu SVG de l’expression.

Objets

Éléments

Le langage connaît les types d'objets élémentaires suivants :

Number : un nombre flottant ;
Vector : un couple de nombres flottants ;
Point : encore un couple de nombres flottants (mais sémantique différente) ;
Polygon : un tuple de points.

Ensembles

Les objets peuvent être groupés dans des objets ensemble de type Set. Les ensembles sont en fait ordonnés, et portent donc mal leur nom. Les ensembles peuvent contenir n’importe quel objet, y compris d’autres ensembles.

Expressions

Les objets sont obtenus en évaluant des expressions. Les types d’expressions sont les suivants :

Number : un nombre flottant littéral, comme dans la plupart des langages, par exemple 3.14 ;
Identifier : une étiquette désignant un objet (créée par une affectation), par exemple pointA ;
FunctionCall : un nom de fonction suivi par une liste d’expressions entre parenthèses séparés par des virgules, par exemple mul(a, b) ;
Set : une liste d’expressions entre accolades séparées par des virgules, par exemple {a, b, c}.

Fonctions

Listes des fonctions

Le langage dispose des fonctions suivantes.

Opérations élémentaires
- add(_, _) : ajoute des nombres ou des vecteurs ;
- sub(_, _) : soustrait des nombres ou des vecteurs ;
- mul(_, _) : multiplie des nombres ou des nombres par des vecteurs ;
- div(_, _) : divise des nombres.
Création d’objets élémentaires
- point(_, _) : crée des points à partir de nombres ;
- vector(_, _) : crée des vecteurs à partir de nombres
- polygon({_, _, ...}) : crée un polygone à partir d’un ensemble (ordonné) de points.
Transformations géométriques :
- translate(_, _) : translate des formes géométriques (points ou polygones) par des vecteurs.
- rotate(_, _, _) : tourne des formes géométriques (points ou polygones) d’angles donnés autour d’un point.

Broadcast

Le broadcast (faute d’un meilleur nom) est probablement la fonctionnalité la plus atypique du langage, même si on la retrouve tout de même régulièrement ailleurs. L’idée du broadcast est que les fonctions sont capables de gérer des ensembles (ordonnés…) en entrée et de sortir un ensemble mappé.

Par exemple :

Pour des nombres x et y, point(x, y) est le point de coordonnées (x, y).
Pour un ensemble s et un nombre y, point(s, y) est l’ensemble {point(x, y) | x ϵ s}.
Pour un nombre x et un ensemble s, point(x, s) est l’ensemble {point(x, y) | y ϵ s}.
Pour des ensembles s1 et s2, point(s1, s2) est l’ensemble {point(x, y) | (x, y) ϵ s1 x s2}.

Avec ça, on peut exprimer des opérations répétitives sans boucle.

Implémentation

Le code est disponible sur GitHub. Il est écrit en Rust, avec l’aide du la bibliothèque lalrpop pour l’analyse lexicale et syntaxique.

Le flot global d’exécution est le suivant :

lecture du code source d’entrée ;
analyse lexicale et syntaxique ;
interprétation du programme.

La première étape n’a rien de fondamentalement intéressant, si ce n’est qu’elle n’est pas du tout programmée de manière ergonomique.

Analyse lexicale et syntaxique

L’analyse lexicale est faite avec le lexer par défaut de lalrpop. Je n’ai pas creusé plus que ça, mais il génère les tokens en ignorant les espaces et autres caractères invisibles, ce qui me convenait bien.

L’analyseur syntaxique est généré par lalrpop à l’aide d’un fichier de grammaire (sobrement appelé parser.lalrpop dans mon cas), qui décrit les règles du langage. La syntaxe ressemble à du Rust, mais n’en est pas vraiment. J’en mets un extrait ci-dessous. On remarque l’imbrication des différentes règles.

StatementBody : Statement = {
    <a:Assignment> => Statement::Assignment(a),
    <r:Render> => Statement::Render(r),
};

Assignment: Assignment = {
    <i:Identifier> "=" <e: Expression> => Assignment {ident: i, expr: e},
};

Render: Render = {
    <e:Expression> ">" <f: Filename> => Render { expr: e, filename:f },
};

Expression: Expression = {
    <i:Identifier> => Expression::Ident(i),
    <n:Number> => Expression::Number(n),
    <c:FunctionCall> => Expression::FunctionCall(c),
    <s:Set> => Expression::Set(s),
};

Interprétation

Exécution d’un programme

L’interpréteur fonctionne en exécutant les lignes les unes à la suite des autres, tout en mettant à jour un contexte (concrètement une hashmap) pour garder trace des identifiants connus.

Au début de l’exécution, le contexte est chargé avec toutes les fonctions builtins du langage. L’interpréteur y aura accès par leur nom pendant l’évaluation des expressions.

Lorsque l’interpréteur exécute une instruction d’affectation, il évalue l’expression puis met à jour le contexte en ajoutant une paire (clé, valeur) liant l’identifiant et le résultat de l’évaluation (un objet).

Lors de l’exécution d’une instruction de rendu, l’interpréteur évalue l’expression et écrit le fichier correspondant en analysant l’objet retourné en termes de polygones SVG.

Évaluation d’expression

L’exécution du programme n’est que la structure de haut niveau de l’interpréteur. L’essentiel des calculs se passe lors de l’évaluation des expressions.

Les expressions sont évaluées par simplification récursive :

pour un ensemble, on évalue les expressions membres et on descend ainsi récursivement,
pour un appel de fonction, on évalue les arguments avant d’appeler la fonction,
pour une expression simple (identifiant ou littéral), on va chercher ou on construit l’objet correspondant.

Fonctions builtins

Les fonctions builtins sont toutes programmées de manière similaire (et c’est très répétitif). L’idée générale est qu’une fonction prend en compte une liste d’objets, fait quelque chose avec et renvoie un objet.

La grande majorité des opérations significative sont faites par les fonctions, qui savent gérer différent types d’objets, opérer sur des ensembles, etc.

Post mortem

Après la clôture de ce petit projet, j’ai quelques remarques sur ce que j’aurai pu ou voulu faire différemment sur ce projet.

Conception du langage

Produit cartésien

Le broadcast est un peu maladroit, parce que c’est à chaque fonction de le gérer correctement. Par exemple l’implémentation de la fonction rotate ne permet pas le broadcast sur le pivot de la rotation.

Avec un produit cartésien à proprement parler, il y aurait possibilité de gérer toutes les fonctions de la même manière. Le programmeur se chargerait de constituer un ensemble de tuples et la machinerie s’occuperait de mapper la fonction appelée sur cet ensemble.

Union d’ensembles

Ça manque un peu pour créer des arrangements plus complexes. C’est assez facile à faire, mais chaque projet-jouet doit avoir une fin.

Opérateurs infixes

J’ai fait l’impasse dessus parce que c’est un peu plus compliqué à mettre en œuvre, mais ça serait vraiment plus pratique et lisible que des appels de fonctions, en particulier pour toutes les opérations usuelles du type add ou mul.

Autres remarques en vrac

J’aurais préféré faire des instructions terminées par un retour à la ligne à la Python, pour éviter du bruit visuel.

Aussi, j’ai hésité entre des appels de fonction à la OCaml (arguments séparés par des espaces, pas de parenthésage global) et la solution actuelle. La solution actuelle me paraissait un peu plus facile à implémenter et c’est donc ce que j’ai choisi.

Encore inspiré par OCaml, j’aurais aimé pouvoir traiter facilement des fonctions d’ordre supérieur et faire plein de compositions de transformations. Un peu trop complexe en regard du plaisir, donc j’ai passé mon tour.

Aussi le nom ensemble est mal choisi, vu qu’il s’agit plutôt de listes.

Le langage mériterait aussi une documentation plus complète, mais ça ne m’intéresse pas plus que ça de l’écrire désormais.

Implémentation

Il y a beaucoup de copie de données dans mon code, par facilité. Si je devais reprendre ce code, c’est un point sur lequel je travaillerai, parce qu’il doit être assez hautement inefficace en l’état.

D’ailleurs l’implémentation est vraiment spartiate, puisqu’elle ne gère en fait pas la lecture de fichiers en entrée. Le code source est écrit en dur dans celui de l’interpréteur. C’est facile à corriger, mais ce ne sera pas fait.

L’implémentation ne gère pas l’entrée correctement, mais la sortie non plus. Le SVG est écrit peu subtilement à coup de print directement dans la gestion de l’instruction de rendu dans l’interpréteur.

6 commentaires

Melcore, mercredi 09 décembre 2020 à 17h26

Billet très sympathique et langage jouet très amusant.

Interresant pour les pavages du plan.

Un peu de difficulté à prendre en main le rotate.

k = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11};
i = mul(k, vector(100, 0));
j = mul(k, vector(0, 100));
vectors = add(i, j);
A = point(50, 0);
B = point(0, 50);
C = point(25, 50);
D = point(25, 100);
E = point(75, 100);
F = point(75, 50);
G = point(100, 50);
arrow = polygon({A, B, C, D, E, F, G});
arrow_rot = rotate(arrow, mul(div(6.28, 2), {1,2}), point(75, 75));
pattern = translate(arrow_rot, vectors);
pattern > "output.svg";

09/12/20 à 17h26

"AH AH" indiqua le perspicace Bosse-de-Nage, à qui rien n’échappait

+2 -0

Aabu, mercredi 09 décembre 2020 à 17h37

Ah, c’est sympathique ça !

Ça me rappelle une piste d’amélioration que je n’ai pas mentionné : pouvoir exprimer des ranges d’entier. Ça revient assez souvent comme besoin.

Sinon, @Melcore, pas trop frustrant à l’utilisation la gestion ultra-minimaliste du rendu ?

09/12/20 à 17h37

+1 -0

Aabu, mercredi 09 décembre 2020 à 18h11

Je ne pense pas qu’on puisse facilement. Le seul moyen "facile" que je vois, ça serait de faire à la main une section finie et profiter d’une potentielle symétrie par rotation.

On pourrait peut-être avoir quelque chose en faisant quelques itérations successives, mais il faudrait probablement les dérouler à la main, et il manque aussi des fonctionnalités (pas de symétries, et pas d’homothétie, pas d’union d’ensembles).

Cet extrait de Wikipédia me fait dire que sans récursion ça semble pas naturel à décrire succinctement :

Many of the common features of Penrose tilings follow from a hierarchical pentagonal structure given by substitution rules: this is often referred to as inflation and deflation, or composition and decomposition, of tilings or (collections of) tiles. The substitution rules decompose each tile into smaller tiles of the same shape as those used in the tiling (and thus allow larger tiles to be "composed" from smaller ones). This shows that the Penrose tiling has a scaling self-similarity, and so can be thought of as a fractal.

09/12/20 à 18h11

+0 -0

Melcore, mercredi 09 décembre 2020 à 20h16

Sinon, @Melcore, pas trop frustrant à l’utilisation la gestion ultra-minimaliste du rendu ?

Aabu

Non, ça va, je suis plus frustré de pas avoir des fonctions mathématiques plus poussé. Genre cos, exp, etc.

09/12/20 à 20h16

"AH AH" indiqua le perspicace Bosse-de-Nage, à qui rien n’échappait

+0 -0

anonyme, mercredi 09 décembre 2020 à 20h58
Modifié

J’ai l’impression qu’un exercice plus intéressant à la fois pour approfondir Rust et pour l’application elle-même serait de concevoir une API Rust directement plutôt qu’un langage. Si tu te débrouilles bien, tu peux directement utiliser les rouages de Rust pour rendre tes divers objets simples à utiliser, et travailler avec des transformations quelconques sur ces objets pour généraliser quasiment à coût nul la chose.

09/12/20 à 20h58
Modifié

+0 -0

Un langage-jouet pour s'exercer en Rust

Démonstration

Papier peint

Squared circle

Description du langage

Instructions

Objets

Éléments

Ensembles

Expressions

Fonctions

Listes des fonctions

Broadcast

Implémentation

Analyse lexicale et syntaxique

Interprétation

Exécution d’un programme

Évaluation d’expression

Fonctions builtins

Post mortem

Conception du langage

Produit cartésien

Union d’ensembles

Opérateurs infixes

Autres remarques en vrac

Implémentation

6 commentaires

Pas encore membre ?