Investigadores liderados por Suketu Patel han puesto a prueba la atención de los modelos de inteligencia artificial mediante una clásica evaluación psicológica conocida como la tarea de Stroop. Este test consiste en presentar palabras que nombran colores escritas en tintas de colores diferentes, y se pide a los participantes que identifiquen el color de la tinta, ignorando el significado de la palabra.
Los expertos observaron que, a diferencia de los humanos, los modelos de lenguaje de grandes dimensiones (LLM) basados en transformers presentan una debilidad significativa en esta tarea cuando las listas de palabras se alargan. A medida que se incrementa el número de palabras, la precisión de la IA cae de forma notable, lo que pone de manifiesto una limitación inherente en su capacidad de toma de decisiones y atención.
Este hallazgo sugiere que, aunque las arquitecturas transformer han avanzado mucho en procesamiento de lenguaje, aún registran fallos importantes en tareas que requieren atención selectiva similar a la humana. La investigación abre la puerta a futuros enfoques para mejorar la atención en modelos de IA, acercándolos a procesos cognitivos más naturales.

