Washington [EE.UU.], 15 de noviembre (ANI): Publicado en la revista 'Proceedings of the National Academy of Sciences (PNAS) el 14 de noviembre, un estudio revela que el motor de red neuronal AlphaZero aprende ajedrez jugando contra sí mismo y gana de forma fiable partidas contra los mejores jugadores de ajedrez humanos.
Según el equipo de investigadores, la interpretabilidad de las redes neuronales es un área de investigación que abarca una amplia gama de enfoques y desafíos. Nuestro interés por relacionar las activaciones de las redes con los conceptos humanos hace que nos centremos principalmente en las llamadas explicaciones basadas en conceptos.
Los métodos basados en conceptos utilizan conceptos comprensibles para el ser humano para explicar las decisiones de la red neuronal en lugar de utilizar características de entrada (por ejemplo, píxeles). Como se ha visto en las referencias, las explicaciones basadas en conceptos se han utilizado con éxito en complejos dominios científicos y médicos. 20-27 y en trabajos concurrentes sobre un agente entrenado para jugar al juego de mesa Hex, así como en el estudio de agentes que juegan al Go utilizando conceptos derivados de anotaciones en lenguaje natural. Al igual que muchos métodos basados en características de entrada, los métodos conceptuales sólo representan la correlación y no la causalidad. Aunque existen métodos basados en conceptos causales, este trabajo se centra en el análisis sin asumir un gráfico causal que podría representar incorrectamente el mecanismo interno.
Un paso clave para estos métodos es la operacionalización de conceptos comprensibles para el ser humano. Un enfoque común, por ejemplo, es definir un concepto mediante un conjunto de ejemplares. En el caso del ajedrez, sin embargo, no necesitamos empezar de cero; muchos conceptos estándar (por ejemplo, la seguridad del rey o la ventaja material) ya se expresan en funciones simplificadas y fáciles de calcular dentro de los motores de ajedrez modernos.
Un análisis reveló que, aunque AlphaZero nunca ha observado una partida de ajedrez humana, muchas características de los ajedrecistas humanos eran discernibles a lo largo del entrenamiento de AlphaZero. El análisis de la estrategia de apertura de la red neuronal descubrió que AlphaZero reducía rápidamente las posibilidades a partir de una gama inicial de movimientos posibles. Según los autores, los resultados sugieren que AlphaZero es capaz de aprender habilidades con relativa rapidez durante un periodo de entrenamiento prolongado. (ANI)
Este informe se ha generado automáticamente a partir del servicio de noticias ANI. ThePrint no se hace responsable de su contenido.