La capacidad de interpretar las emociones y pensamientos de los demás es una característica distintiva de los seres humanos. La llamada teoría de la mente, que nos permite comprender lo que piensan los demás, es fundamental para nuestras interacciones sociales.

En el ámbito de la inteligencia artificial, ChatGPT ha destacado por su habilidad para generar textos coherentes en respuesta a instrucciones específicas. Un reciente estudio publicado en la revista Nature Human Behaviour ha analizado si sistemas como ChatGPT son capaces de emular la teoría de la mente.

Los resultados de la investigación revelan que ChatGPT-4 iguala o supera la capacidad de las personas en la identificación de peticiones indirectas, falsas creencias y desorientación. Sin embargo, muestra dificultades en detectar ciertas interacciones inapropiadas, donde el modelo de Meta, Llama 2, destaca pero con un rendimiento cuestionable.

Experimentos y Resultados

Para evaluar las habilidades de la teoría de la mente, se realizaron pruebas tanto a ChatGPT como a individuos, abordando desde la ironía hasta situaciones donde se requiere especulación. Los modelos de lenguaje generativo demostraron un desempeño similar o superior al humano en la mayoría de las pruebas.

Un ejemplo desafiante fue el caso de John, Mark y un gato, diseñado para confundir a la IA al requerir la comprensión de detalles como la transparencia de un recipiente. En otro escenario, se planteó una historia sobre Laura, Olivia y un cuadro, buscando que se identifiquen las intenciones implícitas de los personajes.

Los resultados del estudio resaltan las similitudes y diferencias en el comportamiento de los modelos de lenguaje en comparación con los humanos. Aunque la IA no puede equipararse a la cognición humana, su capacidad para inferir estados mentales como creencias e intenciones es notable.

Ramon López de Mántaras, experto en Inteligencia Artificial, muestra escepticismo ante los resultados, señalando la necesidad de cautela al interpretar el rendimiento de la IA en pruebas de habilidades generales. Para él, el desempeño en tareas específicas no equivale a una comprensión profunda de dichas habilidades.