Apprendimento per rinforzo: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica |
|||
Riga 1:
L''''apprendimento per rinforzo''' (o ''reinforcement learning'') è una tecnica di [[apprendimento automatico]] che punta ad attuare sistemi in grado di apprendere ed adattarsi alle mutazioni dell'ambiente in cui sono immersi, attraverso la distribuzione di una "ricompensa" detta ''rinforzo'' che consiste nella valutazione delle loro prestazioni. Può essere attuata mediante un algoritmo, come il [[Q-learning]], da inserire all'interno del sistema in cui si vuole realizzare l'apprendimento.
== Descrizione ==
|