Questions et réponses pour le reinforcement-learning :
L'apprentissage de renforcement est un domaine d'apprentissage de la machine et d'informatique concerné comment choisir une action dans un état qui maximise une récompense numérique dans un environnement particulier.
Quelle différence pour l'algorithme fait-il d'avoir une grande ou petite valeur gamma? Dans mon optique, tant que ce n'est ni 0 ni 1, cela devrait fonctionner exactement de la même ma ...