¿Histórico? La IA AlphaZero de DeepMind muestra una intuición humana

El equipo de AlphaZero en el trabajo Crédito: DeepMind
¡Por favor comparta esta historia!
Esta vez es solo un juego de ajedrez, pero en la vida real, ¿realmente queremos una IA que "sacrifique fácilmente a sus soldados por una mejor posición en la escaramuza ... dando mucho menos valor a las piezas individuales"? La intuición es una característica del alma humana, que la IA inerte nunca puede duplicar. ⁃ Editor TN

El programa de inteligencia artificial de DeepMind, AlphaZero, ahora muestra signos de intuición y creatividad similares a los humanos, en lo que los desarrolladores han aclamado como 'punto de inflexión' en la historia.

El sistema informático sorprendió al mundo el año pasado cuando dominó el juego de ajedrez desde cero en solo cuatro horas, a pesar de no estar programado cómo ganar.

Pero ahora, después de un año de pruebas y análisis por parte de grandes maestros de ajedrez, la máquina ha desarrollado un nuevo estilo de juego diferente a todo lo que se haya visto antes, lo que sugiere que el programa ahora está improvisando como un humano.

A diferencia de la mejor máquina de ajedrez del mundo, Stockfish, que calcula millones de posibles resultados a medida que juega, AlphaZero aprende de sus éxitos y fracasos pasados, haciendo sus movimientos basados ​​en una 'sensación nebulosa de que todo va a funcionar a largo plazo , 'según los expertos de Mente profunda.

Cuando AlphaZero se enfrentó a Stockfish en los juegos de 1,000, perdió solo seis, ganando 155 de manera convincente y empatando los combates restantes.

Sin embargo, fue la forma en que jugó lo que sorprendió a los desarrolladores. Mientras que las computadoras de ajedrez prefieren aferrarse a sus piezas, AlphaZero rápidamente sacrificó a sus soldados para una mejor posición en la escaramuza.

En declaraciones a The Telegraph, el profesor David Silver, que dirige el grupo de investigación de aprendizaje por refuerzo en DeepMind, dijo: "Tiene un sentido muy sutil de intuición que lo ayuda a equilibrar todos los diferentes factores".

“Tiene una red neuronal con millones de parámetros ajustables diferentes, cada uno de los cuales aprende sus propias reglas de lo que es bueno en el ajedrez, y cuando las juntas todas, tienes algo que expresa, de una manera bastante cerebral, nuestra capacidad humana para Eche un vistazo a una posición y diga 'ah ha, esto es lo correcto'.

“Mi creencia personal es que hemos visto algo de punto de inflexión en el que estamos comenzando a comprender que muchas habilidades, como la intuición y la creatividad, que antes creíamos que estaban solo en el dominio de la mente humana, en realidad son accesibles para la inteligencia artificial. también. Y creo que es un momento realmente emocionante en la historia ".

AlphaZero comenzó como una 'tabla rasa' o un sistema de pizarra en blanco, programado solo con las reglas básicas del ajedrez y aprendió a ganar jugando millones de juegos contra sí mismo en un proceso de prueba y error conocido como aprendizaje de refuerzo.

Es la misma forma en que el cerebro humano aprende, ajustando tácticas basadas en una ganancia o pérdida anterior, lo que le permite buscar solo 60 mil posiciones por segundo, en comparación con los aproximadamente 60 millones de Stockfish.

En solo unas pocas horas, el programa descubrió y jugó de manera independiente estrategias y aperturas humanas comunes antes de continuar desarrollando sus propias ideas, tales como enjambrazarse rápidamente alrededor del rey del oponente y colocar mucho menos valor en piezas individuales.

El nuevo estilo de juego ha sido analizado por el Gran Maestro de Ajedrez Matthew Sadler y la Maestra Internacional de Mujeres Natasha Regan, quienes lo dicen a diferencia de cualquier motor de ajedrez tradicional.

"Es como descubrir los cuadernos secretos de algún gran jugador del pasado", dijo Sadler.

Regan agregó: “Fue fascinante ver cómo el análisis de AlphaZero difería del de los mejores motores de ajedrez e incluso del mejor juego de Grandes Maestros. AlphaZero podría ser una poderosa herramienta de enseñanza para toda la comunidad ".

Garry Kasparov, ex campeón mundial de ajedrez, que perdió la famosa máquina de ajedrez Deep Blue en 1997, dijo: “En lugar de procesar instrucciones y conocimientos humanos a una velocidad tremenda, como todas las máquinas de ajedrez anteriores, AlphaZero genera su propio conocimiento.

"Juega con un estilo muy dinámico, muy parecido al mío. Las implicaciones van mucho más allá de mi amado tablero de ajedrez".

Lea la historia completa aquí ...

Suscríbete
Notificar de
invitado
0 Comentarios
Comentarios en línea
Ver todos los comentarios