Bonsoir,
Merci pour cet article/tutoriel.
Quelques remarques et questions, à chaud et en désordre:
Le titre du tuto n’est pas très évocateur. Perso ça m’a suffi pour avoir une petite idée de quoi tu allais parler, mais à mon avis ce n’est pas forcément évident pour tout le monde.
Tu utilises parfois des acronymes avant de les définir. P.ex. LSC/ZWJ.
Quelle est la différence entre grapheme, glyphe, symbole ?
Voire compléter avec caractère et codet pour être complet.
Pourquoi le ZWJ est utilisé à certains endroits et pas dans d’autres ? Par exemple, il n’y en a pas avant le symbole qui définit la couleur de peau, mais il y en a entre la personne, son métier et son sexe.
Comment sait-on dans quel cas on doit l’utiliser et dans cas non ? Pourquoi la règle a-t-elle été fixée ainsi ?
Est-ce que l’ordre est important ? Si j’écris "Adulte" + ZWJ + "Informaticien", e’st-ce que c’est la même chose que "Informaticien" + ZWJ + "Adulte" ?
Tu n’expliques pas vraiment pourquoi déterminer ce qui constitue un élément affichable unique/atomique est un problème / pourquoi c’est, semble-t-il, si compliqué.
Ce qui est pourtant, d’après le titre, le point de départ de ton tuto.
Dans le cas où on a le choix, quelle est l’utilité/intérêt d’écrire une lettre accentuée sous sa forme décomposée "e" naturel puis "accent aigü" plutôt que dans sa forme composée habituelle "é" ?
Pourquoi les deux existent ?
Est-ce que la raison de la coexistance est seulement historique ?
Par extension, ça pourrait être intéressant de parler des différentes formes, parce qu’apparament il y en a 4, de ce que j’en comprends: NFC, NFD, NFKC, NFKD.
Quelles sont les différences et lesquelles faut-il utiliser quand ?
Plutôt que quelques indications en vrac, pourquoi ne pas écrire un chapitre ou une section dédiée à la façon de gérer proprement unicode et les emojis dans différents langages, ou de mettre des liens vers des tutoriels qui en parlent déjà ?
Ca fait un peu HS/bizarre de les mettre là où tu les as mises et d’en parler si rapidement, alors que ça peut vraiment valoir le coup de développer. Le sujet de la gestion des strings unicode et en particulier des emojis est plutôt mal connu en général.
Certaines personnes peuvent certainement t’aider pour compléter dans des langages que tu connais mal.
JE pense par exemple à Spacefox qui, si je me souviens bien, a déjà parlé de ce sujet en Java, dans son tutoriel sur l’internationalisation, ou peut-être ailleurs.
Petite appartée sur l’accessibilité: les lecteurs d’écran commencent à interpréter les emojis. Certains reconnaissent les séquences p.ex. "Poignée de mains, peau claire, peau foncée" ou "Informaticienne", tandis que d’autres les rendent toujours sous forme décomposée, p.ex. "Main vers la droite, peau claire, main vers la gauche, peau foncée" ou "Adulte, informaticien, symbole femelle".
Par contre les variantes décomposées des lettres accentuées n’ont pas l’air d’être reconnues, et ça peut donc être un grave problème d’accessibilité. Par exemple, pour le "é" décomposé, Jaws me lit "e" pui rien, en marquant une pause. Si cette séquence s’était trouvée au milieu d’un mot, le mot serait devenu inintelligible (p.ex. "général" serait devenu "je. ne. ral" ou pire, quelque chose du genre "je imprononçAble ne imprononçAble ral").
A noter que j’ai le même problème avec les césures virtuelle, ou en tout cas certaines formes (parce que je crois qu’il y en a plusieurs différentes). Ajoutées automatiquement par certains logiciels/CMS, elles rendent des sites/documents entiers complètement illisibles.
Merci pour tes réponses et éclaircissements.