Bonjour à tous,
Décidément en ce moment je viens beaucoup vous embêter avec des questions de choix techniques
J'ai créé un petit script Node tout bête qui récupère le stream des tweets pour certains mot-clés. Le but est d'enregistrer en base, pour chaque mot-clé, combien de fois celui-ci est apparu dans les tweets.
Donc l'idée de l'algo est la suivante :
- J'écoute le stream
- À chaque tweet, je regarde lequel des mots-clés est présent parmi ceux que je surveille
- J'update en base de données le compteur pour ce jour, ou je le crée s'il n'existe pas encore
Grosso modo, j'ai besoin de trois informations en base :
- La date
- Le mot clé
- Le nombre de tweets pour ce jour
Donc une nouvelle ligne est créée pour chaque jour, ça pas de soucis. Par contre l'update du nombre de tweets peut se faire très très souvent (je dirais une à plusieurs fois par seconde au pire). J'aimerais donc savoir quelle serait la base de données (NoSQL j'imagine ? Je m'en fiche en fait, tant que ça fonctionne) la plus adaptée pour cet usage.
Pour la lecture des infos, je n'ai besoin d'aucune performance particulière. C'est vraiment l'écriture qui es critique.
Merci d'avance