Un programa aprende solo a jugar al Go
Una versión de AlphaGo aprende el juego de estrategia inintervención humana
Una nueva versión del programa de inteligencia artificial AlphaGo, creado por Google, es capaz de aprender a usar el clásico juego de estrategia Go sin intervención humana, según ha publicado este miércoles la revista 'Nature'.
El nuevo algoritmo, bautizado como AlphaGo Zero, ha derrotado por 100 partidas a cero a su predecesor, que logró el reconocimiento mundial al ganar en marzo de 2016 al surcoreano Lee Sedol, campeón del mundo de Go en 18 ocasiones.
El AlphaGo original fue entrenado a partir de un aprendizaje supervisado, a partir de millones de movimientos de partidas disputadas por jugadores humanos expertos, y se sometió después a un proceso de refuerzo con juegos contra sí mismo.
Sin partidas humanas previas
El reto de los ingenieros en la nueva versión del algoritmo era lograr que aprendiera el juego partiendo de una "tabula rasa" y sin ningún conocimiento de partidas humanas previas.
AlphaGo Zero ha adquirido su maestría en el juego de estrategia únicamente disputando partidas contra sí mismo.
Empezó a jugar con movimientos de fichas al azar y fue aprendiendo en cada partida en base a los errores y aciertos cometidos.
El algoritmo funciona en una única computadora dotada con cuatro Unidades de Procesamiento de Tensor (TPU, en inglés), circuitos integrados desarrollados específicamente para el aprendizaje de máquinas.
Cinco millones de partidas contra sí mismo
En tan solo unos días de autoaprendizaje, en los que el sistema jugó cerca de cinco millones de partidas contra sí mismo, AlphaGo Zero ya era capaz de superar a cualquier humano y derrotar a todas las versiones anteriores de AlphaGo.
Los autores del trabajo, ingenieros de la compañía británica DeepMind -adquirida por Google en 2014-, subrayan que su programa de inteligencia artificial ha descubierto de forma independiente algunos conceptos del juego del Go que los humanos tardaron siglos en conceptualizar.
AlphaGo Zero también ha desarrollado nuevas estrategias que no habían sido antes puestas en práctica y que arrojan nueva luz sobre las posibilidades del juego, inventado en China hace más de 2.500 años.
- Muere Itxaso Mardones, reportera de Gloria Serra en 'Equipo de investigación', a los 45 años
- Hacienda te devuelve 300 euros si tienes un hijo menor de 25 años y 900 si tienes dos: así tienes que ponerlo en la declaración de la renta
- ¿Llamadas que cuelgan? Así son las robollamadas, la nueva táctica de spam telefónico
- La querella del novio de Ayuso se admitirá a trámite pese a la campaña del fiscal para que sea rechazada
- El cabecero de madera de Ikea que se ha convertido número uno en ventas por su precio y facilidad de montaje
- La mitad de los nuevos trabajadores indefinidos o son despedidos o renuncian al cabo de un año pese a la reforma laboral
- Sondeo elecciones Catalunya: Los catalanes prefieren a Illa como president y puntúan mejor a Aragonès que a Puigdemont
- El turista vizcaíno Álex García repatriado de Tailandia se encuentra ingresado en la UCI "estable y animado