Bonjour à tous,
J’avais une question "théorique" sur Python (et non sur un bout de code particulier) pour un mini-projet que je dois faire pour dépanner un ami :
Il cherche à filtrer un CSV de base d’adresse mail en supprimant toutes les occurrences d’adresses "pourries" que nous connaissons .
Pour ça il a deux CSV : sa base et un CSV énorme qui liste toutes les adresses "pourries"
Le but est de tous les jours prendre le fichier d’adresse et de le purger de toutes les adresses du CSV de liste pourries(environ 600 000 lignes) .
C’est pour ça que je demande votre aide dans la logique car j’ai fait un truc fonctionnel mais qui je pense pourrait être optimisé.
En gros je charge le CSV pourri dans une liste (après tout c’est un CSV à une seule colonne) et ensuite je parse le CSV de base avec pour chaque ligne un test pour savoir si l’adresse est dans ma liste. Si non j’inscrit la ligne complète dans un nouveau CSV.
Est-ce qu(’il y aurait une manière plus "propre" et surtout plus efficace en terme de temps de traitement de faire ça ?
Merci