Bonjour,
J’essaye de développer un programme qui détecte la langue d’un texte (uniquement l’anglais, pour l’instant). Je compte faire des statistiques sur l’enchainement des lettres pour pouvoir évaluer la probabilité que le texte étudié soit anglais (ou une autre langue, à l’avenir).
Je me heurte toutefois à un problème assez simple : je ne sais pas où trouver de longs textes en anglais pour constituer mes données statistiques…
Pourriez-vous me donner un tuyau ?
Merci d’avance,
+0
-0