Google crea una Inteligencia Artificial capaz de aprender a jugar por sí misma

Google ha desarrollado un programa que, por primera vez, es capaz de aprender a jugar por su cuenta y de forma independiente, lo cual supone un salto muy importante con respecto al tipo de inteligencia artificial existente hasta el momento. Deep Blue, por poner un ejemplo conocido, ganó al ajedrez a Kasparov en el año 1997 gracias a haber sido programado previamente por humanos con las reglas del juego y con estrategias específicas, lo cual sumado a su potencia de cálculo le dio la ventaja necesaria. No aprendió solo.

En el caso de este nuevo “agente”, como lo llaman en Google, estamos hablando de dejar al programa que juegue por sí mismo y aprenda de forma independiente cuál es la mejor estrategia para ganar.

La nueva IA ha aprendido a jugar sola a 49 títulos retro

El año pasado Google compró una compañía llamada DeepMind cuyo objetivo es construir máquinas inteligentes. Ha sido este grupo el encargado de desarrollar el nuevo agente, el cual ha aprendido a jugar sin ayuda a 49 títulos retro distintos.

En este vídeo podemos ver cómo la IA aprende a jugar al clásico ‘Breakout’ de Atari. Fijaos cómo en las primeras partidas va perdidísimo y no sabe qué hacer. El agente sigue entrenando y aprendiendo y, tras 600 rondas, da con una estrategia ganadora. Decide que la mejor forma de superar los niveles es atacando los laterales de la barrera para que la bola se sitúe al otro lado y acabe con ella desde arriba:



Cuando el agente empieza a jugar por primera vez a un juego se produce algo similar a cuando un recién nacido abre los ojos y ve el mundo por primera vez. En este caso la IA observa la información en pantalla y presiona botones de forma aleatoria para comprobar qué sucede.

Utiliza un método llamado Aprendizaje profundo que le permite convertir los inputs visuales básicos en conceptos con significado, de la misma forma que el cerebro humano es capaz de transformar la información sensorial bruta en una comprensión rica del mundo. Gracias, por otro lado, al Aprendizaje por refuerzo, el agente es capaz de detectar aquello que tenga valor. Y de ahí surgen una serie de nociones básicas como esta: ganar puntos es bueno; perderlos es malo.

El agente es muy bueno, pero le queda mucho para ser perfecto

En el estudio, publicado en la revista Nature, figura que el agente tuvo un rendimiento del 75% del nivel de un tester profesional de videojuegos, o incluso superior, en la mitad de los juegos probados, entre los cuales había desde shooters de scroll lateral hasta juegos de conducción en entornos 3D. En juegos como ‘Space Invaders’, ‘Pong’ o ‘Breakout’, el agente logró superar a los humanos, mientras que en otros juegos lo hizo mucho peor.

Los investigadores aseguran que esto es así principalmente por la falta de memoria real por parte del agente, lo cual no le permite establecer estrategias a largo plazo que requieran planificación. Por esta razón, el equipo de DeepMind está intentando construir un componente de memoria para añadirlo al sistema y aplicarlo en juegos más realistas en entornos tridimensionales.


Elon Musk, CEO de Tesla, fue uno de los primeros inversores de DeepMind y asegura que los avances en el campo de la Inteligencia Artificial se producen a tal velocidad que el riesgo de que pueda suceder algo realmente peligroso está en un marco de tiempo situado entre los próximos cinco o diez años a lo sumo. Estáis pensando en Skynet, lo sé.

Hemos hablado del agente en términos de juego, pero es evidente que este tipo de IA capaz de aprender de forma independiente tiene muchas más aplicaciones: coches que conduzcan solos, asistentes personales en smartphones, investigación científica en varios campos y más, mucho más.

Más información | The Guardian