Una implementación de Python de código abierto inspirada en AlphaGo de DeepMind

Contenidos

Si te ha fascinado el programa AlphaGo de DeepMind, hay buenas noticias para ti. Algunos entusiastas de Go han replicado los resultados del Papel AlphaGo Zero, utilizando algunos recursos proporcionados por Google.

170523_alphago_ns_00101-4790366

Fuente: WIRED

Los desarrolladores quieren enfatizar que este proyecto no está asociado de ninguna manera con el programa oficial AlphaGo de DeepMind. Es un esfuerzo independiente inspirado en AlphaGo, pero no afiliado a él.

Según los desarrolladores, Minigo “es una implementación pura de Python de una IA Go basada en redes neuronales, que utiliza TensorFlow”. Agrega algunas características y cambios de arquitectura al «Dominar el juego de Go sin conocimiento humano» papel. Muy recientemente, esta arquitectura se amplió aún más en el «Dominar el ajedrez y el shogi mediante el autojuego con un algoritmo general de aprendizaje por refuerzo» papel.

Los objetivos de este proyecto, descritos por los autores, se enumeran a continuación:

  1. Proporcione un conjunto claro de ejemplos de aprendizaje con Tensorflow, Kubernetes y Google Cloud Platform para establecer canales de aprendizaje por refuerzo en varios aceleradores de hardware.
  2. Reproduzca los métodos de los artículos originales de DeepMind AlphaGo con la mayor fidelidad posible, a través de una implementación de código abierto y herramientas de canalización de código abierto.
  3. Proporcione nuestros datos, resultados y descubrimientos al aire libre para beneficiar a las comunidades de Go, aprendizaje automático y Kubernetes.

Si está interesado en hacer esto en su máquina, puede acceder al código fuente de Minigo y a otros recursos, aquí.

Solo una nota aquí que necesitará lo siguiente antes de poder comenzar:

Nuestra opinión sobre esto

Los desarrolladores mencionan repetidamente que este no es un proyecto de DeepMind y explícitamente no está destinado a competir con AlphaGo. Solo querían que otros desarrolladores de la comunidad entendieran (y tal vez replicaran o mejoraran) cómo funciona el modelo Go. Definitivamente es algo a lo que debe estar atento a medida que se avanza más en este estudio.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.