Apprendimento per rinforzo: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
mNessun oggetto della modifica
Riga 1:
L''''apprendimento per rinforzo''' (o ''reinforcement learning'') è una tecnica di [[apprendimento automatico]] che punta ad attuare sistemi in grado di apprendere ed adattarsi alle mutazioni dell'ambiente in cui sono immersi, attraverso la distribuzione di una "ricompensa" detta ''rinforzo'' che consiste nella valutazione delle loro prestazioni. Può essere attuata mediante un algoritmo, come il [[Q-learning]], da inserire all'interno del sistema in cui si vuole realizzare l'apprendimento.
 
== Descrizione ==