Los agentes de generación automática de código suelen apoyarse en archivos de configuración escritos en Markdown, denominados AGENTS.md o CLAUDE.md, que establecen las pautas sobre su comportamiento y el uso de herramientas. Sin embargo, un nuevo estudio llevado a cabo por investigadores del Instituto Federal de Minas Gerais en Brasil ha detectado que estos archivos suelen estar mal diseñados, lo que repercute negativamente en la eficiencia y calidad del código resultante.
La investigación, que analizó 532.000 archivos de 100 proyectos open source populares, reveló que el 91% de los archivos AGENTS.md contenían al menos uno de seis tipos comunes de “olores de configuración”. Entre estos destacan la “Filtración de reglas” (Lint Leakage), presente en el 62% de los casos, que consiste en incluir instrucciones redundantes ya cubiertas por herramientas automáticas de análisis y formato de código, lo que desperdicia recursos y complica el procesamiento.
Otro problema habitual es el “Exceso de contexto” (Context Bloat), detectado en el 42% de los archivos, donde se sobre especifican comportamientos del agente, elevando así el consumo de tokens, aumentando los costes y dificultando la comprensión de las instrucciones relevantes. Además, el “Desperdicio de habilidades” (Skill Leakage), detectado en un 35%, implica introducir herramientas o prácticas poco usadas en el archivo principal, en vez de cargarlas sólo cuando sea necesario, afectando negativamente al rendimiento del agente.
Otros olores señalados incluyen referencias externas poco claras, instrucciones obsoletas o contradictorias dentro del mismo archivo. Los autores subrayan que tales malas prácticas podrían evitarse mediante herramientas que detecten estas configuraciones problemáticas y recomendar una configuración más concisa.
Las recomendaciones de Anthropic, fabricante de sistemas como Claude, sugieren limitar el texto de estas instrucciones a no más de 200 líneas para evitar consumir demasiado contexto y perder coherencia. Estudios previos, como uno de ETH Zurich, también han constatado que las instrucciones generadas por desarrolladores aumentan costes y apenas mejoran el rendimiento, mientras que las generadas automáticamente incluso pueden perjudicar ligeramente la calidad del código.
En definitiva, el mensaje es claro: menos es más en los archivos de configuración para agentes de código, y una configuración excesiva o desordenada puede perjudicar seriamente la efectividad del agente y elevar costes innecesariamente.

