PySpark filter sur un RDD donne un résultat bizarre.

a marqué ce sujet comme résolu.

Salut à tous,

je suis en train de bosser sur Spark avec PySpark, et en faisant des filters irératifs sur un RDD, j’ai découvert quelque chose d’étrange :

A mon sens, après le filter, on devrait avoir un RDD vide, non ?

Merci d’avance !

Bonjour,

Je ne connais pas PySpark, mais la copie d’ecran laisse penser que ce n’est pas le même RDD (horizontals) qui est appelé dans les 2 cas, ou alors le RDD n’est pas construit correctement. Le code de construction du RDD, pourrait aider à comprendre ce qui ce passe.

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte