Toda semana há um novo "framework de agentes de IA". Pouquíssimos estão perguntando: "Como provamos o que esse sistema realmente fez?" Isso vai se tornar um problema de primeira ordem.