Nettoyer les membres "publicitaires"

Web Scraping ou autres

Le problème exposé dans ce sujet a été résolu.

Bonsoir,

Par hasard, je suis tombé sur un utilisateur n’ayant posté aucun message et ayant de la publicité dans sa bio. Par curiosité, j’ai parcouru la page des membres et rebelote (le pseudo m’a alors mis la puce à l’oreille). J’ai donc signalé ces profils.

En regardant la structure des pages, j’ai mis au point un script Python de web scraping qui parcourt les pages de membres et identifie les utilisateurs ayant au moins un lien dans leur biographie sans avoir publié de message sur le forum.

Ainsi pour les pages 4 à 7 j’obtiens les profils suivants :

https://zestedesavoir.com/@ss7806384
https://zestedesavoir.com/@lahuiss7
https://zestedesavoir.com/@maitreadili

Si ça semble intéressant et est acceptable, je peux fournir le script. Il doit également y avoir d’autres moyens (commande personnalisée Django + ORM par exemple). La solution pourrait également être adaptée (x message minimum, vérification de la zone "site web" aussi ou autres)

Bonne soirée,

EDIT pour être plus clair.

+0 -0

Salut,

On a déjà un outil de ce type, qui s’appelle zds-antispam. Il fait déjà du bon travail, mais est évidemment perfectible.

Par contre, je ne pense pas que ChatGPT soit la solution optimale pour notre usage. On peut améliorer le script existant avec des techniques beaucoup plus efficaces que des requêtes sur un LLM.

Merci d’avoir signalé les profils en tout cas !

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte