AlphaGo es un programa informático de inteligencia artificial
desarrollado por Google DeepMind para jugar al juego de mesa Go. En
octubre de 2015 se convirtió en la primera máquina de Go en ganar a
un jugador profesional de Go sin emplear piedras de handicap en un
tablero de 19x19.
Se enfrentó contra el jugador chino Fan Hui 2p en una serie de 5
partidas oficiales, las cuales AlphaGo ganó, seguidas por unas
partidas informales que acabaron 3-2 a favor de la inteligencia
artificial. En marzo de 2016 se enfrentó a uno de los mejores
jugadores, Lee Sedol 9p. El 9 de marzo de 2016, AlphaGo ganó la
primera partida de este enfrentamiento. Hasta marzo del 2016, AlphaGo
esta rankeado numero dos del mundo en el ranking no oficial de Rémi
Coulom, con un elo de 3585. En reconocimiento por vencer a Lee
Sedol, AlphaGo fue galardonado con un honorario 9-dan por la
Asociación Coreana de Baduk.
El algoritmo de AlphaGo utiliza una combinación de técnicas de
aprendizaje de máquinas y árbol de búsqueda, combinadas con una
amplia formación, tanto desde el juego humano y como del ordenador.
Utiliza árbol de búsqueda Monte Carlo, guiada por una «red de
valor» y una «red de políticas», ambos implementado una profunda
red neuronal tecnología. Una cantidad limitada de detección de
características pre-procesamiento-juego específico se utiliza para
generar las entradas a las redes neuronales.
Las redes neuronales del sistema fueron inicialmente
bootstrapeadas a partir de la experiencia de juego humano. AlphaGo
fue entrenado inicialmente para imitar el juego humano, tratando de
igualar los movimientos de los jugadores expertos de juegos
históricos registrados, utilizando una base de datos de alrededor de
30 millones de movimientos. Una vez que había alcanzado un cierto
grado de habilidad, era entrenado aún más al ser llamado a
desempeñar un gran número de partidos contra otras instancias de sí
mismo, usando aprendizaje por refuerzo para mejorar su juego.
No hay comentarios:
Publicar un comentario