DApp Store | Centrum Web3 pro události a hry

Populární témata

Nový výzkum o zlepšení sebereflexe u jazykových agentů. Jádrem problému sebereflexe agentů je, že modely mají tendenci generovat opakující se odrazy, které přidávají šum místo signálu, což snižuje celkový výkon uvažování. Představuje ParamMem, modul parametrické paměti, který kóduje vzory odrazů napříč vzorky přímo do parametrů modelu a poté využívá vzorkování řízené teplotou k generování různých odrazů v době inference. ParamMem vykazuje konzistentní zlepšení oproti základním SOTA v oblasti generování kódu, matematického uvažování a vícenásobné kontroly kvality. Umožňuje také přenos ze slabých na silné a sebezdokonalování bez nutnosti silnějšího externího modelu, což z něj činí praktický upgrade pro agentické pipeline. Článek: Naučte se vytvářet efektivní AI agenty v naší akademii:

Top

Hodnocení

Oblíbené