Bonjour,
J’essaye de coder un petit projet perso, et je me retrouve fasse à une problématique probablement classique en programmation, à savoir proposer des suggestions. Pour être plus précis, j’ai une liste de journaux scientifiques, et j’essaye de proposer ceux qui correspondent au mieux à l’entrée de l’utilisateur.
Gros "problème", comme j’oriente ma liste dans mon domaine, ben beaucoup de journaux on des noms similaires (j’ai par exemple "journal of Chemical Physics" et "journal of Physical Chemistry" et "Physical Chemistry Chemical Physics", …1). Bref, pour essayer de tenter un truc, j’ai utilisé une distance de Levenshtein, et pour tout dire, ça donne des résultats assez peu satisfaisants (en plus d’être lent quand la liste devient longue, mais peut être que l'implémentation est pas optimale). Bref, ma question est la suivante: comment est ce que je pourrais améliorer ça ? (sachant que je me vois mal utiliser un ElasticSearch juste pour ça).
D’avance merci
- non ce n’est pas une blague. Le monde de l’édition scientifique … ↩