AlphaGo
AlphaGo è un software per il gioco del go sviluppato da Google DeepMind. È stato il primo software in grado di sconfiggere un maestro umano nel gioco senza handicap e su un goban di dimensioni standard (19×19).
Sotto il nome di «AlphaGo» si intendono diverse versioni del software, in particolare:
- la versione che ha sconfitto 5-0 il campione europeo Fan Hui;
- la versione che ha sconfitto 4-1 Lee Se-dol;
- «Master», la versione che ha vinto 60 partite online contro professionisti e ha sconfitto 3-0 Ke Jie;
- «AlphaGo Zero», la versione del software basata completamente sull'auto-apprendimento;
- «AlphaZero», una versione che è in grado di giocare a go, scacchi e shogi.
Storia
modificaSecondo quanto affermato da David Silver, ricercatore di DeepMind, il progetto AlphaGo venne avviato nel 2014 per studiare quanto le reti neurali profonde potessero essere applicabili al gioco del go.[1]
AlphaGo rappresentò un notevole avanzamento rispetto ai programmi per il gioco del go preesistenti. Su 500 partite disputate contro altri software, tra i quali Crazy Stone e Zen,[2] AlphaGo (in esecuzione su un singolo computer) ha vinto tutte le partite tranne una,[3] ed eseguendo una serie di incontri analoga ma girando su un cluster AlphaGo ha vinto tutte le 500 partite e ha vinto il 77% delle partite contro sé stesso eseguito su una singola macchina. La versione distribuita impiegava 1202 CPU e 176 GPU, circa 25 volte in più rispetto all'hardware del computer singolo.[4]
Una versione preliminare di AlphaGo è stata testata su diverse configurazioni hardware, in modalità asincrona o distribuita, con un tempo di due secondi per mossa, generando i seguenti valori Elo.[4]
Configurazione | Thread di ricerca |
n. CPU | n. GPU | Elo |
---|---|---|---|---|
Singola[4] p.10-11 | 40 | 48 | 1 | 2,151 |
Singola | 40 | 48 | 2 | 2738 |
Singola | 40 | 48 | 4 | 2850 |
Singola | 40 | 48 | 8 | 2890 |
Distribuita | 12 | 428 | 64 | 2937 |
Distribuita | 24 | 764 | 112 | 3079 |
Distribuita | 40 | 1,202 | 176 | 3140 |
Distribuita | 64 | 1,920 | 280 | 3168 |
Incontro con Fan Hui
modificaNell'ottobre del 2015 AlphaGo sconfisse 5-0 il campione europeo Fan Hui (2 dan),[5] diventando il primo software in grado di sconfiggere un maestro umano nel gioco senza handicap e su un goban di dimensioni standard.[6] L'annuncio pubblico venne fatto solo il 27 gennaio 2016, in coincidenza con la pubblicazione di un articolo su Nature[7] che descrive l'algoritmo impiegato dal software.[5]
Incontro con Lee Se-dol
modificaTra il 9 e il 15 marzo 2016 AlphaGo disputò un incontro con il giocatore sudcoreano Lee Se-dol (9-dan), uno tra i più forti giocatori di go al mondo.[8] L'incontro in cinque partite, giocate rispettivamente il 9, 10, 12, 13 e 15 marzo, si tenne al Four Seasons Hotel di Seul[9][10] e venne trasmesso in diretta in streaming.[11] AlphaGo girava sulla piattaforma cloud di Google, i cui server si trovano negli Stati Uniti, e le mosse elaborate dal software vennero riportate sul goban da Aja Huang, membro del team DeepMind e giocatore amatoriale di go (6-dan).[12] L'incontro adottava le regole cinesi, con un komi di 7,5 punti e un tempo di riflessione di due ore e un byoyomi di 60 secondi.[13] La potenza di calcolo impiegata era simile a quella usata nell'incontro con Fan Hui.[14]
Al tempo dell'incontro, Lee Se-dol deteneva il secondo numero più alto al mondo di vittorie nei campionati internazionali di Go.[15] Pur non esistendo un ranking ufficiale a livello internazionale, alcune fonti consideravano Lee Se-dol come il quarto miglior giocatore al mondo in quel periodo.[16][17] AlphaGo non era stato configurato in maniera particolare per affrontare lo stile di gioco di Lee.[18]
AlphaGo si è aggiudicato le prime tre partite per abbandono da parte di Lee Se-dol.[19][20] Questi ha vinto la quarta partita, nella quale AlphaGo ha abbandonato alla centottantesima mossa. Il software ha infine vinto l'ultima partita per abbandono.[21]
Il premio per il vincitore dell'incontro era pari a un milione di USD. Essendo stato aggiudicato da AlphaGo, l'importo è stato devoluto ad organizzazioni per il gioco del go e ad organizzazioni di beneficenza, tra le quali l'UNICEF.[22] Lee Se-dol ha ricevuto un compenso di 150 000 USD per la partecipazione a tutte e cinque le partite e un compenso addizionale di 20 000 USD per la vittoria nella quarta partita.[13]
Algoritmo
modificaL'algoritmo impiegato da AlphaGo usa una combinazione di machine learning e tecniche di ricerca su alberi, insieme ad un'estensiva fase di apprendimento da gioco sia umano sia artificiale. Utilizza la ricerca ad albero Monte Carlo (MCTS) per la selezione delle mosse, guidata da due reti neurali profonde (value network e policy network).[23][4] Prima di essere inviato alle reti neurali, l'input è analizzato in una fase di pre-processing per estrarre alcune feature (ad esempio l'aderenza delle mosse a una serie di pattern comuni).[4]
Nella prima fase del training le reti neurali effettuano un apprendimento supervisionato basato sul gioco umano, tentando di imitarlo usando un database di circa 30 milioni di mosse da partite storiche.[24] Una volta raggiunta una certa forza di gioco, l'apprendimento prosegue per rinforzo giocando contro altre istanze di sé stesso.[23]
Il software è programmato per abbandonare la partita se la probabilità di vittoria scende al di sotto di una certa soglia, che ad esempio nell'incontro del marzo 2016 con Lee Se-dol era fissata al 20%.[25]
Confronto tra le versioni di AlphaGo
modificaVersioni | Punteggio Elo | Partite | Hardware da gioco[27] |
---|---|---|---|
AlphaGo "Fan" | 3144[28] | 5:0 contro Fan Hui | 176 GPU,[29] distribuite |
AlphaGo "Lee" | 3739 | 4:1 contro Lee Se-dol | 48 TPU, distribuite |
AlphaGo "Master" | 4858 | 60:0 contro giocatori professionisti; | 4 TPU, macchina singola |
AlphaGo Zero (40 giorni) | 5185 | 100:0 contro AlphaGo "Lee"
89:11 contro AlphaGo "Master" |
4 TPU, macchina singola |
AlphaZero (34 ore) | 4430 (stimato) | 60:40 contro un AlphaGo Zero (3 giorni) | 4 TPU, macchina singola |
Come riferimento, i punteggi Elo di alcuni giocatori umani affrontati da AlphaGo sono:
- Fan Hui (ottobre 2015): 2760[30]
- Lee Se-dol (5 marzo 2016): 3571[31]
- Ke Jie (18 maggio 2017): 3676[32]
Il giocatore umano con punteggio Elo più alto tra quelli registrati è Shin Jin-seo, che ha raggiunto 3827 punti nel 2020.[33]
Accoglienza
modificaAlphaGo è considerato una pietra miliare nella ricerca sull'intelligenza artificiale, in quanto il go era considerato in precedenza un gioco fuori dalla portata delle tecniche di apprendimento automatico sviluppate all'epoca.[34][35] Toby Manning (arbitro del match con Fan Hui) e Haijin Lee (segretario generale della International Go Federation) ipotizzano che in futuro i giocatori di go potranno contare sull'aiuto del computer per l'analisi di gioco.[36]
Myungwan Kim (9 dan) ha descritto lo stile di gioco di AlphaGo "come quello di un umano" nell'incontro con Fan Hui.[37] Toby Manning, arbitro dell'incontro, ha descritto lo stile di gioco del software come "conservativo".[38]
Partita di esempio
modificaAlphaGo (nero) v. Fan Hui, quarto turno (8 ottobre 2015), AlphaGo vince per abbandono.[4]
|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mosse da 1 a 99 | Mosse da 100 a 165 |
Note
modifica- ^ (EN) John Riberio, AlphaGo’s unusual moves prove its AI prowess, experts say, in PC World, 14 marzo 2016. URL consultato il 18 marzo 2016.
- ^ (EN) Artificial intelligence breakthrough as Google's software beats grandmaster of Go, the 'most complex game ever devised', in Daily Mail, 27 gennaio 2016. URL consultato il 29 gennaio 2016.
- ^ (EN) Google AlphaGo AI clean sweeps European Go champion, su zdnet.com, ZDNet, 28 gennaio 2016. URL consultato il 28 gennaio 2016.
- ^ a b c d e f (EN) David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian Schrittwieser, Ioannis Antonoglou e Veda Panneershelvam, Mastering the game of Go with deep neural networks and tree search, in Nature, vol. 529, n. 7587, pp. 484–489, DOI:10.1038/nature16961.
- ^ a b (EN) Google achieves AI 'breakthrough' by beating Go champion, su BBC News, 27 gennaio 2016.
- ^ (FR) Première défaite d’un professionnel du go contre une intelligence artificielle, su Le Monde, 27 gennaio 2016.
- ^ (EN) David Silver e Demis Hassabis, Mastering the game of Go with deep neural networks and tree search, in Nature, vol. 529, n. 7587, 28 gennaio 2016, pp. 484–489, DOI:10.1038/nature16961. URL consultato il 28 gennaio 2016.
- ^ (EN) Computer scores big win against humans in ancient game of Go, su money.cnn.com, CNN, 28 gennaio 2016. URL consultato il 28 gennaio 2016.
- ^ (EN) Google’s AI AlphaGo to take on world No 1 Lee Sedol in live broadcast, su theguardian.com, The Guardian, 5 febbraio 2016. URL consultato il 15 febbraio 2016.
- ^ (EN) Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea, su businessinsider.com, Business Insider, 22 febbraio 2016. URL consultato il 23 febbraio 2016.
- ^ Jordan Novet, YouTube will livestream Google’s AI playing Go superstar Lee Sedol in March, su VentureBeat, 4 febbraio 2016. URL consultato il 7 febbraio 2016.
- ^ (ZH) 李世乭:即使Alpha Go得到升级也一样能赢, su chinese.joins.com, JoongAng Ilbo, 23 febbraio 2016. URL consultato il 24 febbraio 2016.
- ^ a b (KO) 이세돌 vs 알파고, ‘구글 딥마인드 챌린지 매치’ 기자회견 열려, su baduk.or.kr, Korea Baduk Association, 22 febbraio 2016. URL consultato il 5 aprile 2016 (archiviato dall'url originale il 3 marzo 2016).
- ^ (EN) Demis Hassabis [demishassabis], We are using roughly same amount of compute power as in Fan Hui match: distributing search over further machines has diminishing returns (Tweet), su Twitter, X, 11 marzo 2016.
- ^ (EN) Steven Borowiec, Google's AI machine v world champion of 'Go': everything you need to know, in The Guardian, 9 marzo 2016. URL consultato il 15 marzo 2016.
- ^ (EN) Rémi Coulom, Rating List of 2016-01-01, su goratings.org. URL consultato il 18 marzo 2016 (archiviato dall'url originale il 18 marzo 2016).
- ^ (EN) Korean Go master proves human intuition still powerful in Go, in The Korea Herald/ANN, 14 marzo 2016. URL consultato il 5 aprile 2016 (archiviato dall'url originale il 12 aprile 2016).
- ^ (EN) Yoon Sung-won, Lee Se-dol shows AlphaGo beatable, in The Korea Times, 14 marzo 2016. URL consultato il 15 marzo 2016.
- ^ (EN) Google’s AI beats world Go champion in first of five matches - BBC News, in BBC Online. URL consultato il 9 marzo 2016.
- ^ (EN) Google AI wins second Go game against world champion - BBC News, in BBC Online. URL consultato il 10 marzo 2016.
- ^ (EN) Google DeepMind AI wins final Go match for 4-1 series win, su Engadget. URL consultato il 15 marzo 2016.
- ^ (EN) Human champion certain he'll beat AI at ancient Chinese game, su hosted.ap.org, AP News, 22 febbraio 2016. URL consultato il 29 aprile 2019 (archiviato dall'url originale il 22 dicembre 2018).
- ^ a b (EN) Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning, su Google Research Blog, 27 gennaio 2016.
- ^ (EN) Cade Metz, In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go, su WIRED, 27 gennaio 2016. URL consultato il 1º febbraio 2016.
- ^ (EN) Cade Metz, Go Grandmaster Lee Sedol Grabs Consolation Win Against Google’s AI, in Wired News, 13 marzo 2016. URL consultato il 29 marzo 2016.
- ^ (ZH) sohu.com, http://www.sohu.com/a/143092581_473283 .
- ^ L'hardware utilizzato durante l'addestramento potrebbe essere sostanzialmente più potente
- ^ (EN) David Silver, Julian Schrittwieser e Karen Simonyan, Mastering the game of Go without human knowledge (PDF), in Nature, vol. 550, n. 7676, 19 ottobre 2017, pp. 354–359, Bibcode:2017Natur.550..354S, DOI:10.1038/nature24270, ISSN 0028-0836 , PMID 29052630.
- ^ (EN) David Silver, Demis Hassabis, AlphaGo Zero: Starting from scratch, su deepmind.com, 18 ottobre 2017. URL consultato il 4 dicembre 2020 (archiviato dall'url originale il 19 ottobre 2017).
- ^ (EN) Hui Fan, su European Go Database. URL consultato il 4 dicembre 2020.
- ^ (EN) Lee Sedol, su Go Ratings. URL consultato il 4 dicembre 2020.
- ^ (EN) Ke Jie, su Go Ratings. URL consultato il 4 dicembre 2020.
- ^ (EN) Shin Jinseo, su Go Ratings. URL consultato il 4 dicembre 2020.
- ^ (EN) Steve Connor, A computer has beaten a professional at the world's most complex board game, in The Independent, 27 gennaio 2016. URL consultato il 28 gennaio 2016.
- ^ (EN) Google's AI beats human champion at Go, in CBC News, 27 gennaio 2016. URL consultato il 28 gennaio 2016.
- ^ (EN) Elizabeth Gibney, Go players react to computer defeat, in Nature, 2016, DOI:10.1038/nature.2016.19255.
- ^ (EN) Eric David, Google’s AlphaGo “plays just like a human,” says top ranked Go player, su SiliconANGLE, 1º febbraio 2016. URL consultato il 3 febbraio 2016.
- ^ (EN) Elizabeth Gibney, Google AI algorithm masters ancient game of Go, su Nature News & Comment, 27 gennaio 2016. URL consultato il 3 febbraio 2016.
Voci correlate
modifica- AlphaGo contro Fan Hui
- AlphaGo contro Lee Se-dol
- Master versione che ha vinto 60 partite online contro professionisti
- AlphaGo contro Ke Jie
- AlphaGo Zero versione del software basata completamente sull'auto-apprendimento
- AlphaZero
Altri progetti
modifica- Wikimedia Commons contiene immagini o altri file su AlphaGo
Collegamenti esterni
modifica- (EN) Demis Hassabis, AlphaGo: using machine learning to master the ancient game of Go, su Official Google Blog, 27 gennaio 2016.