Dos pioneros de la IA ganan el premio Turing

Edición Impresa

Enseñar a las máquinas de forma parecida a los entrenadores de animales que moldean el comportamiento de perros o caballos fue un método importante para desarrollar la inteligencia artificial y uno que resultó reconocido ayer con el máximo galardón en informática.

Dos pioneros en el campo del aprendizaje por refuerzo, Andrew Barto y Richard Sutton, son los ganadores del Premio A.M. Turing de este año, el equivalente al Nobel en el mundo tecnológico.

La investigación que Barto, de 76 años, y Sutton, de 67, comenzaron a finales de la década de 1970 allanó el camino para algunos de los avances en inteligencia artificial de la última década. Su trabajo giraba en torno a emplear máquinas denominadas “hedonistas” que podían adaptar continuamente su comportamiento en respuesta a señales positivas.

El aprendizaje por refuerzo es lo que llevó a un programa informático de Google a vencer a los mejores jugadores humanos de go, un antiguo juego de mesa chino, en 2016 y 2017. También ha sido una técnica clave para mejorar herramientas de inteligencia artificial populares como ChatGPT u optimizar el comercio financiero.

La investigación buscó responder al desafío de Turing de crear una máquina que “pueda aprender de la experiencia”, lo que Sutton describe como “sin duda la idea esencial del aprendizaje por refuerzo”. Para eso tomaron prestadas ideas de la psicología y la neurociencia sobre la forma en que las neuronas buscan placer en su respuesta a recompensas o castigos.

 

Las noticias locales nunca fueron tan importantes
SUSCRIBITE