Une implémentation Python open source inspirée par AlphaGo de DeepMind

Contenu

Si vous avez été fasciné par le programme DeepMind AlphaGo, il y a de bonnes nouvelles pour vous. Certains passionnés de Go ont reproduit les résultats du Papel AlphaGo Zéro, en utilisant certaines ressources fournies par Google.

170523_alphago_ns_00101-4790366

La source: FILAIRE

Les développeurs tiennent à souligner que ce projet n'est en aucun cas associé au programme officiel AlphaGo de DeepMind. C'est un effort indépendant inspiré par AlphaGo, mais pas affilié.

Selon les développeurs, Minigo "est une implémentation Python pure d'une IA Go basée sur des réseaux de neurones, en utilisant TensorFlow ". Ajoute des fonctionnalités et des changements d'architecture au “Maîtriser le jeu de Go sans connaissance humaine” papier. Très récemment, cette architecture a été encore élargie dans le “Maîtrisez les échecs et le shogi grâce au jeu personnel avec un algorithme général d'apprentissage par renforcement” papier.

Les objectifs de ce projet, décrit par les auteurs, sont listés ci-dessous:

  1. Fournir un ensemble clair d'exemples d'apprentissage avec Tensorflow, Kubernetes et Google Cloud Platform vont établir des canaux d'apprentissage par renforcement sur divers accélérateurs matériels.
  2. Reproduire le plus fidèlement possible les méthodes des articles originaux de DeepMind AlphaGo, via une implémentation open source et des outils de pipeline open source.
  3. Fournir nos données, découvertes et découvertes en plein air au profit des communautés Go, apprentissage automatique et Kubernetes.

Si vous êtes intéressé à le faire sur votre machine, vous pouvez accéder au code source Minigo et à d'autres ressources, ici.

Juste une note ici que vous aurez besoin des éléments suivants avant de pouvoir commencer:

Notre avis à ce sujet

Les développeurs mentionnent à plusieurs reprises qu'il ne s'agit pas d'un projet DeepMind et qu'il n'est explicitement pas destiné à concurrencer AlphaGo. Ils voulaient juste que les autres développeurs de la communauté comprennent (et peut-être qu'ils se reproduiront ou s'amélioreront) comment fonctionne le modèle Go. C'est certainement quelque chose à surveiller à mesure que cette étude va plus loin..

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.