La IA fracasa en la prueba clásica que mide la atención: listas largas de palabras desploman su precisión

Investigadores liderados por Suketu Patel han puesto a prueba la atención de los modelos de inteligencia artificial mediante una clásica evaluación psicológica conocida como la tarea de Stroop. Este test consiste en presentar palabras que nombran colores escritas en tintas de colores diferentes, y se pide a los participantes que identifiquen el color de la tinta, ignorando el significado de la palabra.

Los expertos observaron que, a diferencia de los humanos, los modelos de lenguaje de grandes dimensiones (LLM) basados en transformers presentan una debilidad significativa en esta tarea cuando las listas de palabras se alargan. A medida que se incrementa el número de palabras, la precisión de la IA cae de forma notable, lo que pone de manifiesto una limitación inherente en su capacidad de toma de decisiones y atención.

Este hallazgo sugiere que, aunque las arquitecturas transformer han avanzado mucho en procesamiento de lenguaje, aún registran fallos importantes en tareas que requieren atención selectiva similar a la humana. La investigación abre la puerta a futuros enfoques para mejorar la atención en modelos de IA, acercándolos a procesos cognitivos más naturales.

La IA fracasa en la prueba clásica que mide la atención: listas largas de palabras desploman su precisión

Deja una respuesta Cancelar la respuesta

MUY LEÍDOS

Simp, slay o estar salty: expresiones propias del slang digital de los menores que muchos padres desconocen

MIT, Iberdrola, Siemens, Global Omnium y Bosch analizan la respuesta de Valencia al Informe Draghi

Atos acercará al ciudadano la administración de la Comunidad de Madrid mediante Inteligencia Artificial

Good Game Project se une a Kanjo para incorporar la IA a su plataforma

Comunidad de Facebook