言語エージェントにおける自己反省の向上に関する新しい研究。 エージェントの自己反映の核心的な問題は、モデルが反復的な反射を生成し、信号の代わりにノイズを加え、全体的な推論能力を損なうことです。 ParamMemというパラメトリックメモリモジュールを導入し、クロスサンプル反射パターンをモデルパラメータに直接符号化し、温度制御サンプリングを用いて推論時に多様な反射を生成する。 ParamMemはコード生成、数学的推論、マルチホップQAにおいてSOTAベースラインに比べて一貫した改善を示しています。また、より強力な外部モデルを必要とせずに弱から強さへの移行や自己改善を可能にし、エージェントパイプラインの実用的なアップグレードとなっています。 論文: 私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう: