Bonjour.
Ah la la, les topics "quel est le meilleur langage pour XXX?"… Toujours pareil 50 langages sont cités, mais c'est toujours très compliqué de faire un argumentaire précis.
Bon, déjà, non le C n'est pas une alternative. l'OP demande un langage pour du scripting, le C n'est pas fait pour ça, donc on enlève.
Viennent ensuite le trio historique :
Je ne connais que python très personnellement, et je te le conseille pour plusieurs raisons absolues (c'est à dire sans comparer aux autres, ça sert à rien, ils sauront se plier aux mêmes arguments d'une manière plus ou moins similaire)
- il est extrêmement rapide de scripter avec python, tu as pas mal de choses qui te permettent de parcourir des collections avec peu de lignes de code mais en restant expressif
- python3 gère nativement tous les encodages et utilise par défaut utf8, du coup que ça soit sur linux ou windows, tu peux te permettre d'avoir des chemins bizarres et des fichiers avec des caractères spéciaux
- python possède un ensemble plutôt efficace de lib pour aller chercher et traiter les données, en faire des stats, des clusters etc.
- python3 t'ouvre un accès simple à la programmation asynchrone particulièrement utile quand tu dois aller chercher des fichiers car ces opérations sont en fait 90% d'attente pour seulement 10% de logique programmatique.
Notons que depuis quelques années php est une alternative plutôt sympa pour le scripting MAIS pour la gestion de gros ensembles de données (plus de 100 000 ensembles de plus de 1Mo) ou de fichiers relativement nombreux (>1000 fichiers) je ne te le conseille pas car il n'a aucun concept d'asynchrone pour l'instant.
Autre note, les langages fonctionnels sont particulièrement bien adapté pour les process de gestion de données, c'est dans leur nature. Malheureusement, je n'en connais aucun suffisament pour te les conseiller.