Bonjour à tous, Je me documente en ce moment sur les réseaux de neurones. J'ai un peu compris le fonctionnement lorsque l'on a un ensemble d'exemples à disposition, on l'entraine, on modifie les poids des différents neurones ensuite en rétropropageant l'erreur etc…
Mais si on veut essayer d'optimiser une stratégie de jeu, on n'a pas d'exemple particulier, la seule donnée que l'on puisse avoir c'est si on a gagné ou non la partie à la fin. Dans ce cas là on ne peut directement propager en arrière une erreur. Y a t-il un moyen tout de meme (peut etre avec des algos génétiques) d'entrainer ce réseau de neurones ?
Merci d'avance pour la réponse
+0
-0