Нові дослідження щодо покращення саморефлексії у мовних агентів. Основна проблема саморефлексії агента полягає в тому, що моделі схильні генерувати повторювані відображення, які додають шум замість сигналу, що погіршує загальну продуктивність мислення. Він вводить ParamMem — параметричний модуль пам'яті, який кодує патерни відбиття крос-вибірки безпосередньо в параметри моделі, а потім використовує контрольовану температуру вибірку для генерації різноманітних відбиттів у момент виведення. ParamMem демонструє стабільні покращення порівняно з базовими лініями SOTA у генерації коду, математичному мисленні та багатохоповому контролі якості (QA). Вона також дозволяє передавати від слабкого до сильного та самовдосконалювати без потреби у сильнішій зовнішній моделі, що робить його практичним оновленням для агентних конвеєрів. Стаття: Навчіться створювати ефективних агентів ШІ в нашій академії: