Gli Scienziati Hanno Creato Un'IA Ad Autoapprendimento In Grado Di Riprodurre Tutti I Giochi - Visualizzazione Alternativa

Sommario:

Gli Scienziati Hanno Creato Un'IA Ad Autoapprendimento In Grado Di Riprodurre Tutti I Giochi - Visualizzazione Alternativa
Gli Scienziati Hanno Creato Un'IA Ad Autoapprendimento In Grado Di Riprodurre Tutti I Giochi - Visualizzazione Alternativa

Video: Gli Scienziati Hanno Creato Un'IA Ad Autoapprendimento In Grado Di Riprodurre Tutti I Giochi - Visualizzazione Alternativa

Video: Gli Scienziati Hanno Creato Un'IA Ad Autoapprendimento In Grado Di Riprodurre Tutti I Giochi - Visualizzazione Alternativa
Video: NON SAPEVA CHE FOSSE STATA FILMATA ... GUARDA COSA HA FATTO 😱 2024, Aprile
Anonim

Gli sviluppatori del rivoluzionario sistema di intelligenza artificiale ad autoapprendimento AlphaGo Zero hanno annunciato la creazione di una nuova versione di questa macchina, che può imparare in modo indipendente a giocare a qualsiasi gioco da tavolo e battere una persona. La sua descrizione è stata presentata sulla rivista Science.

Profondità della mente

Il sistema AlphaGo AI è stato sviluppato da David Silver e colleghi alla fine del 2014 e il suo lavoro è stato "testato" sul campione europeo Fan Hui, che ha perso tutte e cinque le partite contro la macchina. Nel marzo 2016, AlphaGo ha sconfitto il campione del mondo Go Lee Sedol in una serie di cinque partite, solo una delle quali si è conclusa con una vittoria umana.

Silver ei suoi colleghi sono stati in grado di ottenere questi successi costruendo la loro intelligenza artificiale sulla base non di una, ma di due reti neurali contemporaneamente: algoritmi speciali che imitano il lavoro delle catene di neuroni nel cervello umano. Uno di loro è responsabile della valutazione della posizione corrente nel consiglio di amministrazione e il secondo utilizza i risultati dell'analisi preparati dalla prima rete per scegliere il passaggio successivo.

Il passo logico successivo nello sviluppo di AlphaGo è stata l'eliminazione del principale inconveniente di tutte le reti neurali e dei sistemi di intelligenza artificiale esistenti: la necessità di insegnare loro cosa dovrebbero fare utilizzando enormi archivi di dati elaborati manualmente da una persona, o con la partecipazione diretta di una persona, come accaduto nelle prime fasi sviluppo di AlphaGo.

Silver e il suo team hanno risolto questo problema creando una rete neurale fondamentalmente nuova basata sui cosiddetti algoritmi di apprendimento per rinforzo. Questa rete neurale, a differenza del suo predecessore stellare, che era stato originariamente addestrato in giochi con volontari e aveva alcune strategie di gioco primitive incorporate, ha iniziato il suo lavoro come un principiante assoluto con zero base di conoscenza.

In altre parole, conosceva solo le regole del gioco del Go, le condizioni iniziali e le condizioni di vittoria, e quindi il computer imparò autonomamente a giocare questa antica strategia cinese, giocando con se stesso e agendo per tentativi ed errori. L'unica limitazione nel suo lavoro era il tempo massimo per pensare al trasloco: era di circa 0,4 secondi.

Video promozionale:

Dopo ciascuna di queste partite, il sistema di intelligenza artificiale analizzava tutte le sue mosse e ricordava quelle che portavano una delle sue "metà" più vicino alla vittoria, ed entrava in una sorta di "lista nera" di quei passaggi che francamente stavano perdendo. Usando questi dati, la rete neurale si è ricostruita, raggiungendo gradualmente il livello che la prima versione di AlphaGo ha raggiunto prima della serie di giochi con Lee Sedol.

Il passaggio agli algoritmi di autoapprendimento non solo ha permesso ad AlphaGo Zero di superare il suo predecessore e di batterlo 100-0, ma ha anche migliorato molti altri aspetti del suo lavoro. In particolare, il processo di formazione ha richiesto solo tre giorni e circa cinque milioni di giochi, un ordine di grandezza inferiore alle richieste della prima versione di AI.

Il percorso verso l'eccellenza

Il completamento con successo degli esperimenti con AlphaGo Zero ha portato Silver e il suo team a valutare se una rete neurale simile potesse essere utilizzata per vincere la corona del campione in altri tipi di giochi di strategia e da tavolo.

Per fare ciò, gli scienziati hanno creato un altro nuovo elemento in AlphaGo Zero: algoritmi euristici per la ricerca casuale di soluzioni, nonché codice che teneva conto dell'esistenza di un pareggio in alcuni giochi. Inoltre, la nuova versione dell'alfa migliorava continuamente la sua struttura, invece di essere aggiornata in più fasi come il suo predecessore.

Questi cambiamenti relativamente semplici, come hanno dimostrato ulteriori esperimenti, hanno aumentato significativamente la velocità di autoapprendimento di questo sistema di intelligenza artificiale e lo hanno trasformato in una macchina universale in grado di giocare a tutti i tipi di strategie da tavolo.

Gli scienziati hanno testato il suo lavoro su tre tipi di giochi: go, scacchi ordinari e la loro varietà giapponese, shogi. In tutti e tre i casi, la nuova idea di Silver ha raggiunto il livello di un grande maestro in meno di un milione di partite, raggiungendo una selettività quasi umana nella scelta delle possibili mosse in sole 9-12 ore di allenamento per gli scacchi e 13 giorni per il go.

In precedenza, ha battuto i programmi per computer più sofisticati che giocano a questi giochi: l'algoritmo di Stockfish ha rinunciato alla quarta ora di allenamento con AlphaZero, mentre Elmo, l'attuale campione di shogi, è durato solo due ore. Infine, la prima versione di AlphaGo iniziò a cedere al suo "nipote" da circa 30 ore della sua formazione.

Le prossime "vittime" di AlphaZero, come hanno notato gli scienziati, potrebbero essere giochi per computer "veri", come Starcraft II e Dota 2. Prendere il campionato in queste discipline di eSport, secondo loro, aprirà la strada all'IA da autoapprendimento per penetrare in aree meno formalizzate della scienza e della cultura e tecnologia.

Raccomandato: