Un'implementazione Python open source ispirata ad AlphaGo di DeepMind

Contenuti

Se sei rimasto affascinato dal programma DeepMind AlphaGo, Ci sono buone notizie per te. Alcuni appassionati di Go hanno replicato i risultati del Papel AlphaGo Zero, utilizzando alcune risorse fornite da Google.

170523_alphago_ns_00101-4790366

Fonte: CABLATO

Gli sviluppatori vogliono sottolineare che questo progetto non è in alcun modo associato al programma AlphaGo ufficiale di DeepMind. È uno sforzo indipendente ispirato da AlphaGo, ma non affiliato con esso.

Secondo gli sviluppatori, Minigo “è una pura implementazione Python di un AI Go basato su reti neurali, utilizzando TensorFlow ". Aggiunge alcune funzionalità e modifiche all'architettura al “Padroneggiare il gioco del Go senza la conoscenza umana” carta. Molto recentemente, questa architettura è stata ulteriormente ampliata nel “Padroneggia gli scacchi e lo shogi attraverso l'auto-gioco con un algoritmo di apprendimento per rinforzo generale” carta.

Gli obiettivi di questo progetto, descritto dagli autori, sono elencati di seguito:

  1. Fornisci una chiara serie di esempi di apprendimento con Tensorflow, Kubernetes y Google Cloud Platform para establecer canales de aprendizaje por refuerzo en varios aceleradores de hardware.
  2. Riprodurre i metodi degli articoli originali di DeepMind AlphaGo il più fedelmente possibile, attraverso un'implementazione open source e strumenti di pipeline open source.
  3. Fornisci i nostri dati, scoperte e scoperte all'aperto a beneficio delle comunità Go, apprendimento automatico e Kubernetes.

Se sei interessato a farlo sulla tua macchina, puoi accedere al codice sorgente di Minigo e ad altre risorse, qui.

Solo una nota qui che avrai bisogno di quanto segue prima di poter iniziare:

La nostra opinione su questo

Gli sviluppatori menzionano ripetutamente che questo non è un progetto DeepMind e non è esplicitamente destinato a competere con AlphaGo. Volevano solo che gli altri sviluppatori della comunità capissero (e forse si replicheranno o miglioreranno) come funziona il modello Go. Definitivamente es algo a lo que debe estar atento a misura que se avanza más en este estudio.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.