Bonjour,
Je monte actuellement une liseuse pour malvoyant (libre). C'est un dire un objet pour lire les magazines/journaux. Actuellement, l'électronique est presque finie, la partie OpenCV aussi, les fonctionnalités pour malvoyants fonctionnent, et il faut que je fasse la structure.
Je souhaite que la liseuse aide aussi les personnes aveugles, Je pense donc embarqué un OCR. J'ai donc quelques étapes :
- Récupérer l'image (facile)
- Découper l'image en groupes de textes (j'utilise k-means, ça donne des résultats basiques, mais fonctionne)
- Hiérarchiser les groupes de textes (pas encore fait), pour donner un ordre de lecture, pratique pour les journaux
- OCR (j'utilise GOCR pour le moment.)
- Corriger la sortie (d'ou ce sujet)
- balancer le texte à une synthese vocale (festival surement)
Je me demande donc comment faire au mieux l'étape de correction, sans retour humain (ce n'est pas à l'aveugle de corriger le texte). Pour l'instant mes pistes sont :
- Automatiser un correcteur type aspell. (sale)
- Embarquer un correcteur comme ceux de libreoffice (GRAC, After the Deadline, etc).
- En développer un (long, et je préfère me concentrer sur d'autres trucs plus importants et je déteste réinventer la roue)
Quelqu'un a déjà réalisé un truc semblable ? Ou a une idée ? Que pensez vous des 3 idées ?
Personnelement, embarquer after the deadline me semble le plus logique.
Merci d'avance !
+3
-0