Un petit langage ZdS

Dominus Carnufex, dimanche 22 mai 2016 à 22h58

J'ai un peu réfléchi à la question, et voici quelques idées et suggestions pour la #TeamFonctionnel. Vous êtes évidemment libres de les accepter ou non, de les compléter, de faire ce que vous voulez…

Les fonctionnalités du langage

Les lambdas

À mon avis, le cœur d'un langage essentiellement fonctionnel, et donc la première chose à définir, ce sont les lambdas, ou fonctions anonymes. Une lambda serait définie par le mot-clé lambda, une liste d'arguments, et un corps de fonction. Par exemple, une lambda qui additionne les carrés de deux nombres prendrait la forme suivante.

1
2
3

(lambda (x y) (
    (+ (* x x) (* y y))
))

Pourquoi définir des lambdas plutôt que des fonctions ? Pour deux raisons. Premièrement, parce qu'un langage fonctionnel puissant se doit de pouvoir passer une fonction en argument à une autre fonction, et renvoyer des fonctions : ces fonctions n'ont pas nécessairement besoin d'être nommées, et il est plus simple d'avoir un mot-clé pour définir une lambda, et un autre pour donner un nom à un objet, qu'un mot-clé pour les fonctions avec un nom, et un autre pour les fonctions anonymes.

Deuxièmement, parce que par leur seul présence, on donne la possibilité d'utiliser des fonctions curryfiées (c'est-à-dire ayant déjà reçu une partie de leurs arguments). Par exemple, la fonction curryfiée (-1) de Haskell se traduirait en zLang par ce code.

1	(lambda x (- x 1))

Le nommage

Ce n'est pas tout de dire qu'on va avoir des fonctions nommées, encore faut-il avoir le mot-clé pour le faire. Celui-ci est tout trouvé : define, suivi d'un nom, puis d'un objet à nommer (qui pour l'instant, ne peut être qu'une lambda).

1
2
3

(define carrédelhypothénuse (lambda (x y) (
    (+ (* x x) (* y y))
)))

Les types natifs

Pour un certain nombre de types, il est plus facile de les définir nativement. À priori, les types natifs suivants suffisent :

Int ;
Int8, Word8, Int16, etc. ;
Float et Double (peut-être même juste le second) ;
Char (qui représente un caractère Unicode, par un entier sur 8 bits) ;
tuple … (par exemple, (tuple Int Char Word64)).

Comme on le verra un peu plus loin, on peut se passer de définir des booléens nativement, on pourra le faire dans la bibliothèque standard. Idem pour les chaînes de caractères, qui seront définis à partir du type liste chaînée qu'on définira dans la bibliothèque standard.

Les types algébriques

Pour ceux qui ne seraient pas familiers de la programmation fonctionnelle, les types algébriques sont un moyen de définir n'importe quel type très simplement par une combinaison de deux procédés :

les types produits, qui ne sont rien d'autre que des tuples nommés, par exemple Point Double Double (c'est du Haskell, comprendre, un Point est la réunion de deux Double) ;
les types sommes, qui permettent à un type de prendre plusieurs formes (on dit qu'il a plusieurs constructeurs). D'où l'exemple suivant, toujours en Haskell.

1	data Bool = False \| True

Il faut comprendre, un Bool peut-être soit un False, soit un True. Et là où cela devient vraiment puissant, c'est qu'on peut combiner les deux. Voici comment une liste chaînée est usuellement définie.

1	data List a = Nil \| Cons a (List a)

En français : une liste de a (List est un type paramétré, on peut mettre n'importe quoi dedans) est, soit une liste vide appelée Nil, soit un Cons, qui est la réunion d'un a et d'une liste de a.

Dans ma première proposition, je suggérais de laisser de côté les types paramétrés dans un premier temps. Je retire cette suggestion, parce que trois des types les plus utiles de la programmation fonctionnelle (les listes, les options (Maybe en Haskell, Option en Rust) et les alternatives (Either en Haskell, Result en Rust)) sont tous paramétrés. On perdrait beaucoup à ne pas les avoir.

Alors voici ma proposition. Pour définir un type, on doit définir un ou plusieurs constructeurs, prenant des types en paramètres. Le type lui-même peut prendre des paramètres, qui peuvent ensuite être utilisés dans les constructeurs. Voici le type Option du Rust, tel qu'il serait défini en zLang.

(define Option (type a (
    None
    (Some a)
)))

Le filtrage par motifs

Pas de grande difficulté là-dedans, une commande match, qui prend une expression, et une série de combinaisons valeur / motif + corps de fonction. Par exemple, une fonction qui fait la somme des éléments d'une liste.

(define somme (lambda liste (
    match liste (
        (Nil 0)
        ((Cons val suite) (+ val (somme suite)))
    )
)))

C'est pour cette raison qu'on peut se contenter de définir dans la bibliothèque standard un type Bool plutôt que d'en faire un type natif. Ce qui en Haskell s'exprimerait comme if x < 3 then x + 2 else x - 6 peut s'exprimer en zLang comme suit.

match (< x 3) (
    (True (+ x 2))
    (False (- x 6))
)

Une question qui reste posée est la suivante : faut-il qualifier les constructeurs ? C'est-à-dire que, quand on l'utilise en dehors de sa définition même, doit-on écrire Bool::True (syntaxe de Rust) ou simplement True (syntaxe de Haskell) ? Dans la plupart des cas, la première solution est la plus pratique : ça permet d'avoir plusieurs types qui ont un constructeur portant le même nom, comme None. Mais pour quelques types (comme les booléens), c'est vraiment plus simple de donner le constructeur directement.

Quatre solutions possibles.

Les constructeurs sont toujours qualifiés.
Les constructeurs ne sont jamais qualifiés (Haskell).
Les constructeurs sont qualifiés par défaut et un mot-clé supplémentaire permet de déqualifier les constructeurs d'un type donné.
Les constructeurs sont qualifiés par défaut mais le mot-clé permettant d'importer dans l'espace de nom courant le contenu d'un module permet d'importer les constructeurs d'un type donné, traité comme s'il était un module (Rust).

Je préfère la dernière solution, même si le mot-clé en question ne deviendra vraiment utile que si l'on finit par ajouter un système de modules.

Les contraintes de types

Comment dire qu'une fonction doit avoir un type donné ? Ou qu'une expression donnée au sein d'une expression plus vaste doit avoir un type donné ? À l'aide du mot-clé hastype, qui s'utilisera de deux façons différentes, comme par exemple, ce qui suit.

1
2
3

(hastype (Double -> Double -> Double) carrédelhypothénuse)

(lambda x (+ x (hastype Word8 42)))

Le premier est pour les éléments qui ont un nom, le second pour les éléments anonymes.

Les entrées-sorties

Si on reste très basiques, on peut se contenter de deux fonctions, getchar et putchar. La principale difficulté, c'est quel type donner à ces fonctions ? Comment faire pour exécuter plusieurs de ces instructions à la suite, comme dans un langage impératif. Il existe une multitude de solutions possibles, n'impliquant pas nécessairement une monade. Je vous laisse y réfléchir.

Un peu de méta

Bon, c'est cool le filtrage par motif, mais la syntaxe utilisée pour une simple condition n'est vraiment pas intuitive, on préférerait avoir if condition cas_true cas_false. Eh bien, c'est tout à fait possible. On pourrait définir ceci dans la bibliothèque standard.

(hastype (Bool -> a -> a -> a) if)

(define if (lambda (cond cas_true cas_false) (
    match cond (
        (True cas_true)
        (False cas_false)
    )
)))

Mais ce n'est pas toujours possible ainsi. Comment définir un mot-clé function qui prend un nom, une liste d'arguments et un corps de fonction, et qui en fait une combinaison de define et de lambda ? Je n'ai pas encore trouvé de solution satisfaisante, alors je vous invite à y réfléchir.

Des commentaires

Le système du C/C++ avec // et /* */ me paraît très bien.

Ce que doit faire l'interpréteur / compilateur

Vérifier qu'il n'y a aucune erreur de syntaxe pure (manque une parenthèse, etc.).
Vérifier que tous les noms utilisés ont été définis à un endroit qui les rend visibles à l'endroit où ils sont utilisés.
Vérifier que toutes les fonctions définies au niveau du programme ont une déclaration de type quelque part.
Vérifier que les déclarations de type sont cohérente entre elles.
Interpréter / compiler.

22/05/16 à 22h58

#JeSuisGrimur #OnVautMieuxQueÇa

+12 -1

the_new_sky, lundi 23 mai 2016 à 06h48

Vu qu'il y a suffisamment de volontaires je créerait un sujet dédié dans la journée avec un petit résumé de ce qui à été dit ici

23/05/16 à 06h48

"C’est nuageux par ici"

+0 -0

Nodraak, lundi 23 mai 2016 à 07h57

On s'en fout du nom. Vous pouvez lui donner un nom qui ressemble à un hash sha512 qu'on s'en taperait encore le coquillard avec une cuisse de grenouille.

Grimur

1 2	$ echo clementine \| sha512sum \| cut -b -6 0b8eac

Vendu ! Mon langage s'appellera donc le 0b8eac.

23/05/16 à 07h57

https://nodraak.fr/

+10 -1

sgble, lundi 23 mai 2016 à 08h58
Modifié

Certains seraient certainement intéressés par Hy, un Lisp implémenté en Python et qui tourne sur la VM Python (Hy est compilé en AST Python, puis exécuté par la VM Python) : http://docs.hylang.org/en/latest/

Les débutants pourraient s'y inspirer (le code est sur GitHub) tandis que les plus expérimentés pourraient y contribuer si jamais ils n'ont pas envie de faire du from-scratch ?

Mais ce n'est pas toujours possible ainsi. Comment définir un mot-clé function qui prend un nom, une liste d'arguments et un corps de fonction, et qui en fait une combinaison de define et de lambda ? Je n'ai pas encore trouvé de solution satisfaisante, alors je vous invite à y réfléchir.

Une macro defn ou defun, tout simplement.

C'est, il me semble, la façon "traditionnelle" des Lisps pour ce faire.

Exemple en Clojure :

1 2	(macroexpand '(defn f [x] (+ x x))) ;; Ceci (def f (clojure.core/fn ([x] (+ x x)))) ;; Donne en fait cela

Sachant qu'en Clojure, le fn c'est comme lambda et le def c'est comme define.

En Hy (puisque j'en ai parlé) :

1 2	(macroexpand '(defn f (x) (+ x x))) ('setv' 'f' ('fn' ('x') ('+' 'x' 'x')))

Common Lisp le fait aussi, avec le macro defun.

Bon, ok ça suppose alors de gérer aussi les macros dans l'implémentation (ce qui n'est pas compliqué en réalité, une fois qu'on a déjà le parser etc.), mais pour commencer un simple hook fera l'affaire, comme si c'était du bête sucre syntaxique.

23/05/16 à 08h58
Modifié

2×3²×5×37

+0 -0

Ricocotam, lundi 23 mai 2016 à 10h24

Pour le nom je suis tout à fait d'accord avec vous. Cependant, il va falloir le décider un jour (je sais c'est pas important mais bon faudra quand même le faire un jour) et surtout c'est tout à fait la seule manière que ceux qui, comme moi, ne connaisse rien du tout à ce sujet puisse participer. Du coup quand on m'envoie chier alors que je fais ce que je peux pour être actif c'est peu plaisant, vous en conviendrez

23/05/16 à 10h24

+5 -3

Gabbro, lundi 23 mai 2016 à 14h13

c'est tout à fait la seule manière que ceux qui, comme moi, ne connaisse rien du tout à ce sujet puisse participer

Dans ce cas, le sujet ne remplit pas ses objectifs.

23/05/16 à 14h13

Il y a bien des façons de passer à l’acte. Se taire en est une. Attribué à Jean-Bertrand Pontalis

+2 -0

Ricocotam, lundi 23 mai 2016 à 17h27

Oui et non, je ne peux pas participer pour l'instant puisque je sais pas comment concevoir un projet comme ceci. Cependant je pourrais participer au développement

23/05/16 à 17h27

+2 -0

the_new_sky, lundi 23 mai 2016 à 18h10

Le but est d'avancer ensemble ! Dans le cas de mon groupe, tout sera disponible ce soir. Un repo Github, un sujet zds, un petit document markdown sur le Github qui réunira des ressources web pour tout le monde.

J'aimerais vraiment qu'on avance bien, qu'on évite les débats de 25 pages mais que l'on ne se précipite pas trop non plus.

23/05/16 à 18h10

"C’est nuageux par ici"

+3 -0

mehdidou99, lundi 23 mai 2016 à 19h00

Je sens qu'on va bien rigoler ! De mon côté, je suis en train de développer un peu mon champ de connaissances en python (avec le cours d'Open Classrooms, faute de mieux) pour pouvoir participer efficacement.

Sinon, j'aime bien le début de spécification de @Dominus Carnufex.

23/05/16 à 19h00

Plus on apprend, et, euh… Plus on apprend. | Apprendre le C++ moderne

+0 -0

nohar, lundi 23 mai 2016 à 19h12
Modifié

@mehdidou le tuto de la doc officielle python est pas mal pour t'y mettre quand tu sais déjà programmer : http://doc.python.org .

Ceetaibement mieux que celui d'OC ej tout cas. Et de loin !

23/05/16 à 19h12
Modifié

I was a llama before it was cool

+4 -1

mehdidou99, lundi 23 mai 2016 à 19h15

Ok, merci

23/05/16 à 19h15

Plus on apprend, et, euh… Plus on apprend. | Apprendre le C++ moderne

+0 -0

the_new_sky, lundi 23 mai 2016 à 19h51
Modifié

Groupe lisp-like

Le sujet dédié au Lisp-like est ouvert !

Voici quelques liens (Attention, il peuvent ne pas être à jour) :

Le repository Github central : ici avec le guide du contributeur et les spécifications.
L'implémentation Python : ici
Ma proposition sur le topic original : ici
Le sondage pour choisir un nom : ici

N'hésitez pas à y participer !

23/05/16 à 19h51
Modifié

"C’est nuageux par ici"

+5 -0

Mohack, mercredi 25 mai 2016 à 12h51

Masqué par Aabu — Hors-sujet

25/05/16 à 12h51

mehdidou99, mercredi 25 mai 2016 à 14h22

Masqué par firm1 — Réponse au message Hors-sujet

25/05/16 à 14h22

anonyme, mercredi 25 mai 2016 à 14h32

Masqué par germinolegrand — Réponse au message Hors-sujet

25/05/16 à 14h32

mehdidou99, mercredi 25 mai 2016 à 14h36
Modifié par germinolegrand

Masqué par germinolegrand — Réponse au message Hors-sujet

25/05/16 à 14h36
Modifié

Croal, mercredi 25 mai 2016 à 17h52
Modifié

Bonne idée. Je suis partant pour aider au projet !

25/05/16 à 17h52
Modifié

+1 -0

mehdidou99, mercredi 25 mai 2016 à 18h03

Je te conseille d'aller faire un tour sur le sujet qui continue celui là (lien ci-dessus), il y a deux projets d'implémentation lançés : en C++ et en Python. J'espère que ça fera ton bonheur, et sinon, tu peux en lancer une dans un autre langage.

25/05/16 à 18h03

Plus on apprend, et, euh… Plus on apprend. | Apprendre le C++ moderne

+0 -0

felko, mercredi 25 mai 2016 à 18h58
Modifié

@the_new_sky: peux-tu penser à nous ajouter à l'organisation comme ça on peut créer de dépôts pour nos implémentations (je pense à mehdidou99 pour C++ et pour LudoBike en Haskell par exemple) ?