Bonsoir à tous !
Je suis en train d’examiner un texte possiblement chiffré, et je suis en train de le passer au crible de plusieurs tests, afin d’en savoir plus à son sujet. J’ai donc, par exemple, utilisé l’indice de coïncidence, qui est assez efficace pour savoir si l’on a affaire ou non à un chiffrement poly-alphabétique. Je suis maintenant à la recherche d’un indice permettant de discerner si l’on a ou non affaire à un chiffrement par transposition, quel qu’il soit. En existe-il un ?
Je me suis un peu creusé la tête et, en l’absence d’indice existant, je vous proposerais le raisonnement suivant : dites-moi ce que vous en pensez.
Dans une langue naturelle, il est ce qu’on appelle des règles phonotactiques : en bref, ce sont les probabilités que la lettre y suive la lettre x (px(y)). On aboutit donc, pour une langue donnée, à un tableau phonotactique, qui montre les probabilités de consécutivité (par exemple, chez nous, le Q est quasi-systématiquement suivi par un U, etc.).
Je fais l’hypothèse qu’un chiffrement par transposition va tendre à rendre les probabilités de consécutivité assez uniformes. Ainsi, par exemple, le Q pourra être suivi de n’importe quelle lettre (A, Z, D, F, etc.). En d’autres termes, le chiffrement par transposition tend à diminuer l’hétérogénéité phonotactique.
Comme indices de l’hétérogénéité phonotactique, j’identifie la variance de tous les px(y) du tableau phonotactique (ainsi que le nombre de cases où px(y) vaut 0, que je n’utilise pas ici).
Cependant, bien sûr, le fonctionnement décrit plus haut n’est qu’une tendance : il faut donc la moduler en fonction de la longueur du texte et du nombre de caractères utilisables dans le texte (moins il y en a, moins il peut y avoir de variabilité phonotactique).
Ainsi, j’aboutis à l’indice suivant :
I=taillealphabet×tailletexteV(∑x,ypx(y))
Il est plus que probable que j’ai fait des erreurs dans mon raisonnement : qu’en pensez-vous ? Même partiels, vos avis peuvent beaucoup m’aider !
La moindre remarque est la bienvenue ,
Dwayn