DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Neue Forschung zur Verbesserung der Selbstreflexion in Sprachagenten. Ein zentrales Problem bei der Selbstreflexion von Agenten ist, dass Modelle dazu neigen, sich wiederholende Reflexionen zu erzeugen, die Rauschen statt Signal hinzufügen und die Gesamtleistung des Denkens beeinträchtigen. Es wird ParamMem eingeführt, ein parametrisches Speichermodul, das Muster der Reflexion über verschiedene Proben direkt in die Modellparameter kodiert und dann temperaturgesteuertes Sampling verwendet, um vielfältige Reflexionen zur Inferenzzeit zu erzeugen. ParamMem zeigt konsistente Verbesserungen gegenüber SOTA-Baselines in der Codegenerierung, mathematischen Argumentation und Multi-Hop-QA. Es ermöglicht auch einen schwachen zu starken Transfer und Selbstverbesserung, ohne ein stärkeres externes Modell zu benötigen, was es zu einem praktischen Upgrade für agentische Pipelines macht. Papier: Lernen Sie, effektive KI-Agenten in unserer Akademie zu bauen:

Top

Ranking

Favoriten