Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Nový výzkum o zlepšení sebereflexe u jazykových agentů.
Jádrem problému sebereflexe agentů je, že modely mají tendenci generovat opakující se odrazy, které přidávají šum místo signálu, což snižuje celkový výkon uvažování.
Představuje ParamMem, modul parametrické paměti, který kóduje vzory odrazů napříč vzorky přímo do parametrů modelu a poté využívá vzorkování řízené teplotou k generování různých odrazů v době inference.
ParamMem vykazuje konzistentní zlepšení oproti základním SOTA v oblasti generování kódu, matematického uvažování a vícenásobné kontroly kvality. Umožňuje také přenos ze slabých na silné a sebezdokonalování bez nutnosti silnějšího externího modelu, což z něj činí praktický upgrade pro agentické pipeline.
Článek:
Naučte se vytvářet efektivní AI agenty v naší akademii:

Top
Hodnocení
Oblíbené
