Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
Нові дослідження щодо покращення саморефлексії у мовних агентів.
Основна проблема саморефлексії агента полягає в тому, що моделі схильні генерувати повторювані відображення, які додають шум замість сигналу, що погіршує загальну продуктивність мислення.
Він вводить ParamMem — параметричний модуль пам'яті, який кодує патерни відбиття крос-вибірки безпосередньо в параметри моделі, а потім використовує контрольовану температуру вибірку для генерації різноманітних відбиттів у момент виведення.
ParamMem демонструє стабільні покращення порівняно з базовими лініями SOTA у генерації коду, математичному мисленні та багатохоповому контролі якості (QA). Вона також дозволяє передавати від слабкого до сильного та самовдосконалювати без потреби у сильнішій зовнішній моделі, що робить його практичним оновленням для агентних конвеєрів.
Стаття:
Навчіться створювати ефективних агентів ШІ в нашій академії:

Найкращі
Рейтинг
Вибране
