À la découverte de Julia

Un nouveau langage pour le calcul scientifique

Ce contenu est obsolète. Il peut contenir des informations intéressantes mais soyez prudent avec celles-ci.

Dans cet article, je vais vous présenter un nouveau langage, Julia. Ce langage est en développement au MIT depuis 2009, et la première version publique date de 2012. Il est actuellement en phase de stabilisation des fonctionnalités pour sa version 0.4.

Un nouveau langage pour quoi faire ?

Encore un nouveau langage !? Mais il n'y en a pas déjà assez ?

Un programmeur désabusé

En effet, il existe déjà beaucoup — certains diront trop — de langages de programmation dans le monde. Il y a deux raisons principales à ce foisonnement :

  • Beaucoup de langages ne sont utiles que dans un domaine spécifique : R pour les statistiques, SQL pour les bases de données relationnelles, …
  • Dès qu'un groupe de nerds n'est pas satisfait des langages qui existent déjà, ils créent le leur. Cela ajoute d'autres langages génériques à la liste déjà longue (ce fut le cas du C, du C++, du Python à leur époque ; et de plein d'autre que le monde a oublié entre temps).

Dans le cadre de Julia, la création d'un nouveau langage est basée sur ces deux points à la fois. En effet, dans le domaine de la programmation scientifique (les auteurs de Julia parlent de technical computing), il existe plusieurs langages utilisables. Ces langages peuvent être classés en trois catégories :

Haut niveau Bas niveau générique Bas niveau spécialisé
Python C Assembleur
Matlab C++ CUDA
Mathematica FORTRAN OpenCL
R
ACL
Et tout un tas d'autres …

Les langages de haut niveau sont souvent plus pratiques pour exprimer des idées et tester différentes méthodes. Les langages de bas niveau généraliste peuvent aussi être utilisés pour tester des méthodes, et offrent de meilleurs temps d'exécution (en général). Ils font payer cela par un temps de développement plus long (en général aussi, merci de ne pas ouvrir un troll ^^). Les langages de bas niveau spécialisé offrent des performances encore meilleures, contre un apprentissage complexe et un temps de débogage long.

En général, la création de logiciels scientifique suit le schéma suivant :

  1. Écrire du code en Python (Matlab, …) pour pouvoir tester des idées et écrire plein de prototypes rapidement ;
  2. Optimiser en implémentant les points bloquant (ou l'intégralité du programme) dans un langage plus bas niveau. Parce que même 5% de temps en moins sur 3 semaines, c'est quand même bien.
  3. Si besoin — et si l'on sait faire — utiliser un ou plusieurs langages spécifiques pour améliorer encore les performances. Il est aussi possible d'utiliser des outils comme MPI ou OpenMP pour paralléliser le code.

C'est ce que l'on appelle le problème des deux langages : on est obligé d'utiliser deux (ou plus) langages différents pour avoir à la fois de bonnes performances et exprimer facilement ses idées. C'est un problème parce que les gens qui font de la programmation technique ne sont généralement pas intéressés par le code : ils veulent utiliser l'informatique comme un outil, pas passer des heures à programmer.

Et c'est à ce problème spécifique que s'attaque Julia. Dans l'article originel de présentation de Julia, les auteurs affirment que :

Julia has the performance of a statically compiled language while providing interactive dynamic behavior and productivity like Python, LISP or Ruby.

Bezanson, J., Karpinski, S., Shah, V. B., & Edelman, A. (2012). Julia: A fast dynamic language for technical computing.

Comment ça marche ?

Un brin de magie

La technologie magique1 qui permet ce quasi-miracle de performances et d'interactivité est celle de compilation à la volée, ou de compilation Just In Time (JIT) en anglais.

Cela consiste principalement à compiler à la volée le code source en code machine. À chaque fois que l'utilisateur entre du code dans l'interpréteur, ce dernier est compilé et exécuté sous forme de code machine.

Cette compilation JIT est effectuée en utilisant le projet LLVM, qui consiste en un ensemble d'outils pour créer des compilateurs.

Et des bibliothèques

Julia utilise aussi pas mal d'autres bibliothèques compilées pour certaines de ses fonctionnalités :

  • libuv (la bibliothèque derrière Node.js) pour la gestion des entrées et sorties de manière asynchrone ;
  • BLAS et LAPACK pour l'algèbre linéaire ;
  • FFTW pour les transformées de Fourier ;
  • libmojibake pour la gestion de l'Unicode ;
  • Et quelques autres bibliothèques maison :

    • openlibm (une implémentation générique de la bibliothèque mathématique C) ;
    • openspecfun pour les fonctions spéciales ;
    • et libosxunwind pour les stacktraces sous OS X.

Le cœur du langage est écrit en C, et le parseur en LISP. La quasi-intégralité de la bibliothèque standard est écrite directement en Julia.

Tout ça pour dire que même si on a là un nouveau langage, les auteurs ne réinventent pas non plus la roue.


  1. "Toute technologie suffisamment avancée est indiscernable de la magie." (Arthur C. Clarke

Bon, et ça ressemble à quoi ?

Vous pouvez tester tout le code de cet article depuis votre navigateur, soit avec un notebook temporaire (le choix du langage est à droite), soit sur JuliaBox si vous avez un compte Google — vous pouvez y utiliser un notebook, et même lancer une console pour les plus barbus d'entre vous. L'interpréteur se lance avec la commande julia.

Une syntaxe simple

La syntaxe de Julia est plutôt simple. Elle ressemble beaucoup à celle de Matlab, ou de Ruby. Un exemple ? Voyez-vous même :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
a = 5
# a est un entier
b = 67.67e42
# b est un flottant

# La variable a est ré-affectée dynamiquement au type String
a = "Bonjour"

c = a + 3 * b^4

d = sin(atan(3)) # Utilisation de fonctions

Ce qui est bien, c'est que comme on est en 2015, les variables Unicode sont autorisées :

1
2
3
α = 56

ΔΨ = 78 * α

On les tape depuis la console julia, qui connaît un certain nombre de complétions LaTeX : \alpha + tab donne α.

Les chaînes de caractères aussi, et on peut même faire de l'interpolation de chaînes à la mode Perl :

1
2
3
toi = "K¬öba†‹f›"
println("Bonjour, $toi !") # println affiche une ligne de texte
println("12 est de type $(typeof(12))")

Le typage de Julia est fort, dynamique et inféré. Le compilateur devine automatiquement le type des variables :

1
2
3
4
5
6
a = 12   # Int64 ou Int32 selon les machines
b = 12.0 # Float64
c = "Bonjour, ça zeste ?" # UTF8String
d = true # Bool
e = [12, 34, 45] # Array{Int64}
f = [12.0, 34, "Youhou !"] # Array{Any}

Julia est un langage qui a ses origines à la fois dans la programmation orientée objet, et dans la programmation fonctionnelle. Il est possible (et même obligatoire) de définir des fonctions :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
# Déclaration de fonction sans annotations de type
function add(a, b)
    return a + b
end

# Déclaration de fonction avec annotations de types
function add(a::String, b::String)
    "$a & $b" # la dernière instruction est la valeur de retour
end

# Déclaration de fonctions sous forme courte :
f(x) = 42 * x^3

# Et même de lambdas :
g = x -> 42 / x^6

Avec Julia, tous les objets sont des citoyens de première classe : les types utilisateurs sont aussi puissants, compacts et rapides que les types de base du langage. Il existe trois versions de types : les types abstraits, les types normaux et les types immuables (non modifiable) :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
abstract Vehicule

type Voiture <: Vehicule
    modele::String       # Variable membre de type String
    vitesse_max::Float64 # Variable membre de type Float64
end

immutable Velo <: Vehicule
    pignons::Integer
end

# On crée les objets avec la syntaxe suivante
velo1 = Velo(12) # un vélo à 12 pignons
velo2 = Velo(15) # un vélo à 15 pignons

println(velo1.pignons) # Les attributs sont publiques
println(velo2.pignons)

L'opérateur <: est l'opérateur d'héritage est un. On ne peut créer de types dérivés (des types hérités) que depuis les types abstraits, et il est impossible de créer un objet ayant un type abstrait. Les types peuvent aussi être paramétrés (on retrouve là des outils de programmation générique à la C++) par d'autres types, ou par des objets immuables :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
# Type Vendeur paramétré par un type héritant de véhicule
type Vendeur{T<:Vehicule}
    stock::Integer
    véhicules::Vector{T} # Tableau à une dimension (Vector) de T
end

# On peut avoir un objet vendeur de vélos
boutique_de _velos = Vendeur{Velo}(2, [velo1, velo2])
# Et un concessionnaire automobile
concessionnaire = Vendeur{Voiture}(0, Voiture[])

# Le paramétrage peut aussi être déterminé automatiquement par le compilateur
vendeur_velos = Vendeur(1, [vélo1])

println(typeof(vendeur_velos))
# -> Vendeur{Velo}

Un objet, des méthodes : le dispatch multiple

Julia est orienté objet, mais avec un modèle qui n'est pas le même que celui de Python, Java ou C++. Ici, il n'y a aucune fonction membre (aussi parfois appelées méthodes) définie à l'intérieur des types. À la place, Julia utilise le concept de dispatch multiple pour implémenter son modèle objet. L'idée est de sélectionner une version spécifique d'une fonction en fonction de l'ensemble des types des paramètres.

Prenons un exemple : il existe plusieurs types de véhicules. Parmi eux, des véhicules à roues et des véhicules sans roues. Parmi les véhicules à roue, on peut retrouver les vélos, les motos et les voitures.

Relations entre objets en Julia

Sur des objets de type véhicule, plusieurs types de fonctions peuvent être utilisés : avancer pour tous les véhicules, rouler pour les véhicules à roues, remplir le réservoir pour les véhicules à essence, … Mais la manière de le faire dépendra partiellement du type d'objet considéré. Chaque fonction sera donc implémentée (spécialisée) pour les types d'objets, chaque implémentation étant appelée une méthode dans le monde de Julia.

Dans certains cas, il n'est pas nécessaire de spécialiser explicitement une fonction, le compilateur pouvant se charger de spécialiser un algorithme pour les différents arguments. C'est ainsi que toutes les opérations sur les matrices sont implémentées, quel que que soit le types de matrice: Triangulaire, Hermitienne, … Seules certaines fonctions sont spécialisées pour prendre en compte les spécificités (typiquement le calcul des valeurs propres).

Voici comment on pourrait implémenter notre exemple de véhicules :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
abstract Vehicule
abstract VehiculeARoues <: Vehicule
abstract VehiculeARouesEtAEssence <: VehiculeARoues

type Bateau <: Vehicule end
type Velo <: VehiculeARoues end
type Voiture <: VehiculeARouesEtAEssence end
type Moto <: VehiculeARouesEtAEssence end

# Définition des fonctions : une version générique
function avancer(v::Vehicule)
    println("En avant !")
end

function avancer(v::VehiculeARoues)
    # pour les véhicules à roues, la fonction avancer appelle
    # directement la fonction rouler
    rouler(v)
end

function rouler(v::VehiculeARoues)
    println("Ça roule !")
end

function remplir_le_reservoir(v::VehiculeARouesEtAEssence)
    println("Glou glou glou …")
end

bateau = Bateau()
velo = Velo()
voiture = Voiture()
moto = Moto()

# La détermination de la bonne méthode est faite automatiquement:
avancer(bateau)   # -> En avant !
avancer(velo)    # -> Ça roule !
avancer(voiture) # -> Ça roule !
avancer(moto)    # -> Ça roule !

remplir_le_reservoir(voiture) # -> Glou glou glou …


# S'il n'existe pas de méthode adaptée, une erreur est levée
remplir_le_reservoir(velo)
# ERROR: MethodError: `remplir_le_reservoir`
# has no method matching remplir_le_reservoir(::Velo)

# On peut encore spécialiser les méthodes :
function rouler(m::Moto)
    println("Broouum !")
end

# La fonction générique est appelée
avancer(voiture) # -> Ça roule !
# La fonction spécialisée est appelée
avancer(moto)    # -> Broouum !

Les différentes méthodes peuvent être spécialisées manuellement ou automatiquement par le compilateur. Il n'est jamais nécessaire de préciser les types, et la fonction la plus spécialisée sera toujours appelée lors de l’exécution. Et cette spécialisation a lieu sur les types de l'ensemble des paramètres :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
# Fonction par défaut, sans spécification de types
function foo(a, b) # version 1
    # Cette fonction peut être utilisée pour tous les types
    # qui implémentent l'opérateur +
    return a + b
end

function foo(a::Integer, b) # version 2
    println("Le premier argument est un entier")
    return a + b
end

function foo(a, b::Integer) # version 3
    println("Le second argument est un entier")
    return a + b
end

function foo(a::Integer, b::Integer) # version 4
    println("Les deux arguments sont des entier")
    return a + b
end

function foo(a::String, b::Integer) # version 5
    println("Le premier argument est une chaine, ",
            "et le second argument est un entier")
    return string(a, b)
end

foo(3.6, 5.9)      # utilise la version 1
foo(3, 5.9)        # utilise la version 2
foo(3.6, 6)        # utilise la version 3
foo(4, 2)          # utilise la version 4
foo("Bonjour ", 5) # utilise la version 5

# Comme aucune autre version n'est définie, cet appel utilise la version 1
# Mais ceci renvoie une erreur, car il n'y a pas d'opération + entre
# chaînes.
foo("Bonjour ", "le monde")

function foo(a::String, b::String)
    return a * b # La concaténation se fait avec l'opérateur *
end

# On a défini une fonction entre temps, tout va bien.
foo("Bonjour ", "le monde")

Ce fonctionnement basé sur le multiple dispatch est entre autres ce qui permet à Julia d'obtenir sa rapidité à l'exécution. En effet, les fonctions sont compilées à la volée pour chaque jeu d'argument, ce qui permet à chaque fois d'avoir du code natif optimisé. On peut explorer ce code avec la fonction code_native, qui affiche l'assembleur obtenu (julia> est le prompt de l'interpréteur) :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
julia> function bar(a, b) return a + b end
bar (generic function with 1 method)

julia> code_native(bar, (Float64, Float64))
    .section    __TEXT,__text,regular,pure_instructions
Filename: none
Source line: 1
    push    RBP
    mov RBP, RSP
Source line: 1
    vaddsd  XMM0, XMM0, XMM1
    pop RBP
    ret

julia> code_native(bar, (Int, Int))
    .section    __TEXT,__text,regular,pure_instructions
Filename: none
Source line: 1
    push    RBP
    mov RBP, RSP
Source line: 1
    add RDI, RSI
    mov RAX, RDI
    pop RBP
    ret

Même si comme moi vous n'y connaissez rien en assembleur, vous remarquerez que les instructions sont spécialisées à la fois pour l'architecture du processeur, et pour les types utilisés. Cette spécialisation a aussi lieu pour les types définis par les utilisateurs.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
julia>  immutable Point
            x::Float64
            y::Float64
        end

julia>  function add(p::Point, q::Point)
            return Point(p.x + q.x, p.y + q.y)
        end
add (generic function with 1 method)

julia> # Le code LLVM est quand même plus lisible que l'assembleur

julia> @code_llvm add(Point(3.4, 4.4), Point(3.5, 6.5))

define %Point @julia_add_42523(%Point, %Point) {
top:
  # Addition des valeurs de x
  %2 = extractvalue %Point %0, 0, !dbg !504
  %3 = extractvalue %Point %1, 0, !dbg !504
  %4 = fadd double %2, %3, !dbg !504
  # Insertion du résultat de l'addition dans un nouveau point
  %5 = insertvalue %Point undef, double %4, 0, !dbg !504
  # Addition des valeurs de y
  %6 = extractvalue %Point %0, 1, !dbg !504
  %7 = extractvalue %Point %1, 1, !dbg !504
  %8 = fadd double %6, %7, !dbg !504
  # Insertion du résultat de l'addition dans le nouveau point
  %9 = insertvalue %Point %5, double %8, 1, !dbg !504, !julia_type !506
  # Et on retourne le nouveau point
  ret %Point %9, !dbg !504
}

# À comparer au code créé pour la même fonction définie sur des tuples:
julia> function add(p::(Float64,Float64), q::(Float64,Float64))
           return (p[1]+q[1], p[2]+q[2])
       end
add (generic function with 2 methods)

julia> @code_llvm add((3.4, 4.4), (3.5, 6.5))

define <2 x double> @julia_add_42670(<2 x double>, <2 x double>) {
top:
  %2 = extractelement <2 x double> %0, i32 0, !dbg !965
  %3 = extractelement <2 x double> %1, i32 0, !dbg !965
  %4 = fadd double %2, %3, !dbg !965
  %5 = insertelement <2 x double> undef, double %4, i32 0, !dbg !965, !julia_type !967
  %6 = extractelement <2 x double> %0, i32 1, !dbg !965
  %7 = extractelement <2 x double> %1, i32 1, !dbg !965
  %8 = fadd double %6, %7, !dbg !965
  %9 = insertelement <2 x double> %5, double %8, i32 1, !dbg !965, !julia_type !967
  ret <2 x double> %9, !dbg !965
}

Autres points intéressants

Interface vers le C ou le Fortran

Comme on n'allait pas se passer de tout un tas de bibliothèques juste pour le plaisir, il est extrêmement facile d'appeler du C ou du Fortran depuis Julia (l'intégration du C++ est en cours de développement). Ce mécanisme est appelé FFI (Foreign function interface). Par exemple, si vous avez un fichier C qui contient la fonction suivante

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
/* Add 'a' to all the values in the array 'b' of size 'n',
 * and return the mean value of 'a'.
 */
double foo(int a, int* b, int n){
    int i = 0;
    double res = 0;
    for (i=0; i<n; i++){
        b[i] += a;
    }

    for (i=0; i<n; i++){
        res += b[i];
    }

    return res/n;
}

Et que vous le compilez sous la forme d'une bibliothèque partagée libbar.so ou bar.dll, vous pouvez alors appeler la fonction foo depuis Julia aussi simplement que ça:

1
2
3
a = 5
b = [4, 5, 6, 7]
c = ccall((:foo, :bar), Float64, (Int32, Ptr{Int32}, Int32), a, b, length(b))

Il y a correspondance exacte en mémoire des types C et Julia, et la conversion est faite automatiquement par la fonction ccall. L'utilisation de code Fortran, se fait exactement de la même manière.

Les macros : du code qui créé du code

Une autre capacité intéressante de Julia réside dans sa capacité à utiliser des macros, dans l'esprit de Lisp. Une macro est un bout de code qui est capable de créer d'autre code à l’exécution. Par exemple, la fonction printf du C est implémentée en Julia sous la forme d'une macro : @printf. Cette macro génère donc du code spécialisé pour chaque invocation, code qui sera compilé à chaque fois.

Dans l'exemple qui suit, du code spécialisé est généré pour afficher une chaîne de caractères, et un entier. La fonction macroexpand force la génération des macros, et affiche le code correspondant.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
macroexpand(:(@printf("Test: %s ", "Brocolis")))
# quote
#    #72#out = Base.Printf.STDOUT
#    #73###x#2591 = "Brocolis"
#    local #66#neg, #67#pt, #68#len, #69#exp, #70#do_out, #71#args
#    Base.Printf.write(#72#out,"Test: ")
#    begin
#        Base.Printf.print(#72#out,#73###x#2591)
#    end
#    Base.Printf.write(#72#out,' ')
#    Base.Printf.nothing
# end

macroexpand(:(@printf("Test: %d", 42)))
# quote
#    #75#out = Base.Printf.STDOUT
#    #76###x#2592 = 42
#    local #81#neg, #80#pt, #79#len, #74#exp, #77#do_out, #78#args
#    Base.Printf.write(#75#out,"Test: ")
#    if Base.Printf.isfinite(#76###x#2592)
#        (#77#do_out,#78#args) = Base.Printf.decode_dec(#75#out,#76###x#2592,"",0,-1,'d')
#        if #77#do_out
#            (#79#len,#80#pt,#81#neg) = #78#args
#            #81#neg && Base.Printf.write(#75#out,'-')
#            #Base.Printf.write(#75#out,Base.Printf.pointer(Base.Printf.DIGITS),#80#pt)
#        end
#    else
#        Base.Printf.write(#75#out,begin  # printf.jl, line 143:
#                if Base.Printf.isnan(#76###x#2592)
#                    "NaN"
#                else
#                    if (#76###x#2592 #Base.Printf.< 0)
#                        "-Inf"
#                    else
#                        "Inf"
#                    end
#                end
#            end)
#    end
#    Base.Printf.nothing
# end

Du code différent est généré pour chaque appel à la macro, code qui pourra être compilé et être optimisé pour chaque appel à la macro.

Et beaucoup d'autres choses !

Je n'ai pas le temps de parler de tout, mais Julia a encore plein de fonctionnalités sympas:

  • La programmation parallèle en mémoire distribuée est intégrée au langage (la mémoire partagée est en cours de développement);
  • Il existe des packages pour appeler du code Python, Java, R, et donc utiliser les immenses bibliothèques disponibles dans tous ces langages;
  • Des fonctionnalités d'interpréteur de commande shell;
  • Et une communauté chaleureuse et accueillante qui créé plein de choses avec ce nouveau langage !

Et c'est performant ?

Oui, parce que c'est bien beau d'avoir un language tout neuf, mais s'il ne crache pas des gigaflops, ce n'est pas très intéréssant.

Notre programmeur désabusé

Eh bien oui, le langage se défend pas mal ! C'est avant tout un langage dynamique où il est possible d'écrire des boucles comme en C, et d'avoir les performances du C. Il y a un premier jeu de benchmark sur le site de Julia, mais j'aimerai vous présenter un autre graphique :

Vitesse d'exécution du code en fonction du nombre de lignes Source: La liste de diffusion julia-user

Ce graphique compare la taille des codes sources, et la rapidité d'exécution sur un ensemble d'algorithmes. Et il est clair que Julia se situe dans le bon coin : celui des bonnes performances, et d'une faible taille de code, donc d'une bonne expressivité.

Alors certes il ne s'agit que de benchmarks, certes ce ne sont que des exemples simples, toutefois le résultat est impressionnant.

Pour un exemple de code plus conséquent, cette discussion concerne l'implémentation des bibliothèques de FFT en pur Julia. Et les performances actuelles sont exactement comparables à celles de FFTPACK ou de FFTW, tout en ayant seulement 1/3 du nombre de lignes !

Mais on peut s'en servir en vrai ?

Selon votre domaine, Julia sera plus ou moins facilement utilisable. Ainsi, pour faire des sites web, peu de frameworks existent, et il vous faudra écrire beaucoup de code bas niveau. De même, pour faire des statistiques, même si beaucoup de packages existent, Julia est encore loin derrière R. Par contre, pour faire de l'optimisation mathématique, de la manipulation d'images ou du machine learning, vous trouverez tout ce qu'il vous faut.

D'autre part, le langage est encore en pleine évolution. Si la série de versions 0.3 à 0.3.7 sont toutes compatibles, la version 0.4 introduit de gros changements non rétro-compatibles. En pratique , sur les 8 mois que j'ai passés à m'amuser avec ce langage, je n'ai eu besoin de mettre à jour mon code qu'une seule fois à cause des changements introduits.

Dans tous les cas, les versions stables sont relativement stables, et le langage est mature et utilisable. Il est déjà utilisé en production pour de l'analyse de donnée à grande échelle, et quelques articles scientifiques l'utilisant commencent à apparaitre.

En savoir plus

J'espère vous avoir donné envie de tester Julia, pour l'installation sur votre machine, c'est par là ! Voici quelques liens pour vous accompagner dans votre apprentissage, et n'hésitez pas à utiliser le forum, je serais ravi de vous aider !

Et quelques liens plus techniques :

Merci à Kje pour m'avoir incité à me lancer dans cet article et pour l'avoir relu dans tous les sens, et à toute la communauté de ZdS pour donner envie d'écrire ici !


24 commentaires

Merci pour cet article plutôt bien expliqué. C'est très clair et j'aime bien ton style d'écriture.

J'avoue que je suis resté un peu sur ma faim.

En lisant le paragraphe "Comment ça marche ?", si j'ai bien compris, le langage ne doit ses performances qu'au fait que son cœur est quasi écrit en C (le JIT étant déjà la norme partout ailleurs) ? Du coup, quel serait l'avantage de Julia par rapport à Cython en terme de performances par exemple ?

Du coup, qu'en est-il de la portabilité du langage ?

Il fait l'optimisation pour les fonctions tail-recursives ?

Saroupille

Non, et ce n'est pas prévu si j'ai tout bien compris. L'explication est ici. Il y a bien quelques packages pour faire de l'évaluation paresseuse, mais dans la plupart des cas il vaudra mieux utiliser une grosse boucle à la place de la récursion, Julia étant beaucoup plus capable de les optimiser.

En lisant le paragraphe "Comment ça marche ?", si j'ai bien compris, le langage ne doit ses performances qu'au fait que son cœur est quasi écrit en C (le JIT étant déjà la norme partout ailleurs) ?

Non, pas du tout. Quand je parle de coeur, je parle de quelques types de base, de la libm, et d'une petite partie du système de types et de fonctions. Toute la lib standard est implémentée en Julia.

Du coup, quel serait l'avantage de Julia par rapport à Cython en terme de performances par exemple ?

Les performances viennent de deux choses : le JIT avec compilation par LLVM qui optimise comme un bourrin, et le dispatch multiple. Le dispatch multiple permet de sélectionner les algorithmes les plus performant à l’exécution ou à la compilation d'une fonction. Le plus proche de ce fonctionnement que je connaisse est les templates en C++, sauf que en Julia tout est template : les types et toutes les fonctions. Chaque fonction est spécialisée et compilée lors de sa première utilisation.

Du coup, qu'en est-il de la portabilité du langage ?

Alors pour l'instant le langage est utilisable sur les architectures 64 et 32 bits intel. Le portage est en cours vers les ARM. Les compilateurs utilisables sont pour l'instant GCC et ICPC, mais MSVC revient souvent dans les issue et devrait être supporté un jour.

EDIT: visiblement l'ARM intéresse des gens, voici la liste des issues liées.

Sinon la portabilité est la même que Python : dès que tu as installé l'interpréteur, tu peut utiliser le langage.

+0 -0

En lisant le paragraphe "Comment ça marche ?", si j'ai bien compris, le langage ne doit ses performances qu'au fait que son cœur est quasi écrit en C (le JIT étant déjà la norme partout ailleurs) ?

Oui et non. En réalité c'est LLVM qui fait le gros du boulot de perf. Le coeur de Julia est en réalité écrit en Julia car les spécifites du langage permette de le décrire a partir d'un très petit subset. Typiquement tous les opérateurs ne sont en réalité que des appels de méthodes.

Du coup, quel serait l'avantage de Julia par rapport à Cython en terme de performances par exemple ?

C'est difficilement comparable. Déjà Cython ne fait pas de compilation a la volée, il faut lui demander de compiler les sources. Ensuite Cython ne fait pas de déduction de type. En pratique si tu passe par Cython un module python, tu ne va gagner que le temps d'interprétation. Le code continuera a appeler toute la circuiterie de python. Julia va générer un code exécutable en fonction des paramètres. Rien a voir donc. On peut plus facilement comparer Julia a un Java sans pré-compilation en bytecode, si ta JVM faisait son taf directement depuis tes sources en .java.

Du coup, qu'en est-il de la portabilité du langage ?

firm1

La meme que celle de llvm et de ces dépendance. Le langage est encore jeune donc a part les windows/linux/osX sur x86-64, je ne suis pas surs qu'il y est eu beaucoup de tests mais probablement que ça tournera facilement sur ARM.

A titre personnel je suis pas mal Julia depuis un moment. Principalement car je travail dans le domaine cible et que je rencontre justement régulièrement le problème qu'ils cherchent a résoudre. Actuellement on utilise du Python avec des libs natives bindés ou des modulés optimisés en Cython pour les parties critiques, mais c'est vrai que c'est chiant, autant au déploiement qu'au developpement.

Il est important de noter que le langage est encore jeune. Ce que je trouve encore bloquant c'est l'écosystème encore trop limité et sa vitesse de démarrage. Mais ces deux points vont s'améliorer avec le temps.

J'avais seulement entendu le nom de Julia sans vraiment m'y intéresser, et de ce que je vois dans l'article (très bien expliqué), ça ne me semble pas transcendant. On dirait simplement du Lisp avec une syntaxe de langage de script moderne (à la Ruby ou Python).

Du coup… J'ai juste l'impression que c'est "un langage de plus". A moins que je sois passé à côté d'une killer feature.

Il n'y a pas spécialement de killer-feature ou de grosse nouveauté. Julia essai juste de proposer un langage moderne et efficace pour une problématique précise. Les créateurs du langages sont très pragmatique et on retrouve une philosophie proche de celle des dev Python : ne pas chercher à faire le meilleur langage pour tout résoudre mais qu'il fasse bien son taf pour ce pourquoi il a été conçu.

Et leurs objectifs c'est de faire un langage avec des perfs proches du C avec une facilité d'utilisation et de développement proche de celles des langages de script comme Python, particulièrement pour le calcul numérique. Tout ce qui sort de ce cadre n'est pas prioritaire pour eux.

Parmi les langages qui promettent concision, vitesse et sécurité, il y a Rust (qui utilise aussi LLVM, et est apparu à la même période, en 2010). À part qu'il ne présente pas comme spécialisé scientifique, quel est la différence ?

Je dirai que la dernière phrase de Kje s'applique pas mal à Rust.

+0 -0

À part qu'il ne présente pas comme spécialisé scientifique, quel est la différence ?

Ça principalement. Pour les scientifiques, les langages généralistes manquent de certaines fonctionnalités importantes; en particulier des tableaux multidimensionnels, des facilités d'algèbre linéraire, la FFT, …

Le C ou le C++ n'ont pas un accès simple à ces fonctionnalités, donc tout le monde utilise des bibliothèques. Pour python, c'est numpy qui donne accès à tout cela. L'avantage de Fortran/Matlab/Julia est que comme tout est accessible dans le langage, il n'est pas nécessaire d'aller apprendre à utiliser une autre bibliothèque.

D'autres langages pourrait être cool pour la programmation scientifique (Haskell, Rust, …) mais il leur manque une utilisation simple de ces concepts, et il me semble (mais je peut me tromper) qu'ils manquent aussi des bibliothèques pour la programmation parallèle (le couple MPI/OpenMP est à la base de tout).

Je dirai que la dernière phrase de Kje s'applique pas mal à Rust.

Je ne connais pas trop Rust, j'ai juste jeté un oeil. Mais les dev semblent plutôt avoir mis l'accent sur la programmation système sûre que sur les performances. Un autre problème de Rust est qu'il faut préciser si une variable va être ou non mutable, là où dans la plupart des cas en science, il sera plus efficace de modifier directement le tableau courant.

+0 -0

D'autres langages pourrait être cool pour la programmation scientifique (Haskell, Rust, …) mais il leur manque une utilisation simple de ces concepts, et il me semble (mais je peut me tromper) qu'ils manquent aussi des bibliothèques pour la programmation parallèle (le couple MPI/OpenMP est à la base de tout).

Même si je ne connais pas le détail, il est possible de faire de la programmation parallèle en Haskell. Et sinon, oui, j'ai un peu l'impression qu'il lui manque de bonnes bibliothèques de calcul scientifique. Mais dans le même temps, son fonctionnement est très « mathématique », les fonctions de Haskell ressemblant plus à des fonctions mathématiques qu'à des fonctions de langage impératif. Donc à mon avis, c'est à peser. :)

+1 -0

D'autres langages pourrait être cool pour la programmation scientifique (Haskell, Rust, …) mais il leur manque une utilisation simple de ces concepts, et il me semble (mais je peut me tromper) qu'ils manquent aussi des bibliothèques pour la programmation parallèle (le couple MPI/OpenMP est à la base de tout).

Même si je ne connais pas le détail, il est possible de faire de la programmation parallèle en Haskell. Et sinon, oui, j'ai un peu l'impression qu'il lui manque de bonnes bibliothèques de calcul scientifique. Mais dans le même temps, son fonctionnement est très « mathématique », les fonctions de Haskell ressemblant plus à des fonctions mathématiques qu'à des fonctions de langage impératif. Donc à mon avis, c'est à peser. :)

Dominus Carnufex

Pour Haskell, le problème porte plus sur l'immutabilité de toutes les données, et la complexité du langage. J'ai essayé de m'y mettre deux trois fois, et je n'ai pas encore réussi à accrocher. Et quand on me dit que les monade sont des monoïdes dans le groupe des endofoncteurs, je décroche ^^

L'argument sur les fonctions revient souvent, mais j'ai un peu de mal avec. Quand je regarde ça :

1
2
-- Version haskell
f x = 3*x + 5
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
! version fortran 
double precision :: f

f(x) = 3*x + 2

! Autre version
real function g(x)
    implicit none
    real :: x
    g = 3 * x +2
end function
1
2
3
4
5
6
# Version julia
f(x) = 3*x + 2

function g(x)
    5 * x^2
end

Je ne vois pas vraiment de différence entre les langages.

+0 -0

Je ne connais pas assez Rust (et pour tout dire je n'utilise pas souvent Julia non plus) mais Rust me semble plus bas niveau, ou du moins Julia me semble plus haut niveau. Tout d'abord, Rust est, si je ne me trompe pas, compilé, tandis que Julia fait ça à la volé. De l’extérieure Julia ressemble à un langage de script. Ensuite dans les constructions du langage, contrairement à Rust, je ne sais même pas si il est possible d’accéder aux pointeurs sous-jacent en Julia. Et si c'est le cas (fort possible), c'est pas du tout dans la logique du langage.


Pour le reste le caractère scientifique a vraiment de l'importance, ces concurents dans ce domaine sont plutot R, matlab ou Python+numpy+scipy

Et si c'est le cas (fort possible), c'est pas du tout dans la logique du langage.

Kje

C'est possible, et c'est utile pour écrire des bibliothèques. Mais on peut totalement s'en passer quand on écrit juste un petit script.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
julia> a = [10, 45, 1]
3-element Array{Int64,1}:
 10
 45
  1

julia> p = pointer(a)
Ptr{Int64} @0x00007fd7851d23e0

julia> unsafe_load(p, 2)
45

julia> unsafe_store!(p, 68, 2)
Ptr{Int64} @0x00007fd7851d23e0

julia> a
3-element Array{Int64,1}:
 10
 68
  1

Et c'est utile pour appeler des bibliothèques C. Il n'y a aucune conversion de faite, c'est le même bout de mémoire qui est utilisé par le C et par Julia.

+1 -0

Nous d’abord, merci pour cet excellent tuto !

Si on peut imposer un type aux variables si l’on veut, mais revenons à la différence avec les autres langages.

# Création d'une fonction courte
f(x) = -3x^2 + 2x + 1
# f (generic function with 1 method)
# Nous dit qu'il y une seule méthode de nom "f".
# Cette unique méthode ne fait pas du tout la même chose
# en fonction du type (inféré) des paramètres reçus.

f(3)
# => -20

f(3.14)
# =>-22.2988

f(22//7)
# => -1095//49

f(2.5+2im)
# => -0.75 - 26.0im

m=rand(3,3)
# =>
# 3x3 Array{Float64,2}:
#  0.0370891  0.558951  0.455372
#  0.740509   0.415971  0.292384
#  0.654818   0.144046  0.87581 

f(m)
# =>
# 3x3 Array{Float64,2}:
#  -1.06623    1.1614     0.173331
#   0.900156  -0.055231  -0.559944
#   0.196284  -0.368172  -0.57042 

# On peut spécialiser une fonction pour un type donné :
f(x::Int) = 2x
# => f (generic function with 2 methods)
# nous dit maintenant qu'il y deux méthodes de nom "f"

# testons les 
f(3)
# => 6

f(3.0)
# => -20.0
+2 -0

bonjour, J aurais besoin d un petit coup de main de votre part sur julia car je doit traduire un exercice d’optimisation mais je n’arrive pas vraiment a cerner comment julia fonctionne et n’arrive donc pas a traduire ce calcul

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
            n     n
    Z= Min  Σ     Σ   Dij * Xij 
           i=1   j=1

tel que 


 n
 Σ   Xij = 1      Ɏ1<=j<=n  
i=1


 n
 Σ   Xij = 1     Ɏ1<=i<=n  
j=1


 n    n               n    n
 Σ    Σ  Xil = 1      Σ    Σ   Xlj = 1      
i=1  l=1             l=1  j=1



 n
 Σ  X0j = 1                              
j=1


 n
 Σ  Xi0= 1                             
i=1

Xij  [0;1]          

0<=i,i<=n   `

si quelqu’un pouvais m’indiquer la marche a suivre pour la traduction de ce problème je lui en serais gres

sachant que mon programme doit pouvoir prendre en entrée un fichier de donnée .. en conséquence les valeur des paramétré principaux du problème seront défini Par les fichier de donnée et le programme doit permettre une lecture aisée de la solution obtenu

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte