AlphaGo: differenze tra le versioni
Contenuto cancellato Contenuto aggiunto
→Algoritmo: fix wl |
|||
Riga 49:
== Algoritmo ==
L'algoritmo impiegato da AlphaGo usa una combinazione di [[machine learning]] e tecniche di ricerca su [[albero (informatica)|alberi]], insieme ad un'estensiva fase di apprendimento da gioco sia umano sia artificiale. Utilizza la [[
Nella prima fase del training le reti neurali effettuano un [[apprendimento supervisionato]] basato sul gioco umano, tentando di imitarlo usando un database di circa 30 milioni di mosse da partite storiche.<ref name=MetzWired2016>{{Cita web|titolo= In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go|url= https://www.wired.com/2016/01/in-a-huge-breakthrough-googles-ai-beats-a-top-player-at-the-game-of-go/|sito= WIRED|accesso= 1º febbraio 2016|lingua= en|data= 27 gennaio 2016|cognome= Metz|nome= Cade}}</ref> Una volta raggiunta una certa forza di gioco, l'apprendimento prosegue [[apprendimento per rinforzo|per rinforzo]] giocando contro altre istanze di sé stesso.<ref name="googlego"/>
|