Questions et réponses pour le reinforcement-learning :

L'apprentissage de renforcement est un domaine d'apprentissage de la machine et d'informatique concerné comment choisir une action dans un état qui maximise une récompense numérique dans un environnement particulier.

9
votes
Quelle différence pour l'algorithme fait-il d'avoir une grande ou petite valeur gamma? Dans mon optique, tant que ce n'est ni 0 ni 1, cela devrait fonctionner exactement de la même ma ...