Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
CUDA-Agent er den første kjente RL-treningsmodellen, og overgår Claude Opus-4.6 og Gemini 3 Pro i CUDA-kjernegenerering!
CUDA Agent bruker agentisk RL for å trene modeller til automatisk å generere høyytelses CUDA-kjerner, direkte ved å bruke reell GPU-profileringshastighet som belønningssignal, og dermed bryte formen
Ta en titt på følgende data:
KernelBench-benchmark: Simple/Medium-kjerner er 100 % raskere enn torch.compile, komplekse kjerner er 92 % raskere
Totalt 96,8 % raskere rate sammenlignet med torch.compile, langt bedre enn Claude Opus 4.5/Gemini 3 Pro (omtrent 40 %)
Det virkelige taket for AI-maskinvare er evnen til å «programvare låse opp + optimalisere lukket sløyfe», ikke bare selve brikken.
Kombinert med den samtidige Apple Ane-hendelsen: Apple M4 ANE: 6,6 TFLOPS/W (80 ganger så mye som ≈ A100), er hundrevis av millioner enheter inaktive, og flaskehalsen er lukket API + abstraksjonslag (CoreML-skjermer 2–4 ganger gjennomstrømning)
NVIDIA GPU: RL Agent lærer «ultimate optimalisering med reell maskinvarefeedback», noe som beviser at den lærte strategien kan slå statiske regler
Maskinvarens ytelsesvollgrav (Apple/Nvidia) blir drept av AI som «reverse engineering + RL-optimalisering» – førstnevnte knuser lukkede API-er for å gjøre ledige brikker om til datakraftfarmer, og sistnevnte bruker forsterkningslæring for å presse ut hver eneste dråpe ytelse fra eksisterende GPU-er. I fremtiden er det ikke maskinvaren som blir sittende fast, men den som først mestrer den lukkede sløyfen med «maskinvarebasert tilbakemelding + uavhengig læringsoptimalisering», både myk og hard, som kan doble ytelsen til eksisterende utstyr, kan bryte gigantenes vegg steg for steg. Denne sammensatte veksten skaper en hastighet som er vanskelig for menneskelig intuisjon å oppfatte: fra 10 ganger til 100 ganger → 1 000 ganger på noen få år
Æraen med opplæring på enheten (ANE-siden) + sky-/edge ekstrem inferens (CUDA Agent-siden) har akselerert, og AI selv kan "selvoptimalisere" til nær det teoretiske toppnivået. Potensialet til hundrevis av millioner inaktive Apple-enheter + massive NVIDIA-kort blir samlet åpnet av uavhengige/bedriftshackere/forskere.


Topp
Rangering
Favoritter
