Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
CUDA-Agent jest pierwszym znanym modelem RL do treningu, który przewyższa Claude Opus-4.6 i Gemini 3 Pro w generowaniu rdzeni CUDA!
CUDA Agent wykorzystuje model treningowy agentic RL do automatycznego generowania wysokowydajnych rdzeni CUDA, bezpośrednio używając rzeczywistej prędkości profilowania GPU jako sygnału nagrody, łamiąc konwencje.
Zobacz poniższe dane:
Benchmark KernelBench: proste/średnie rdzenie są 100% szybsze niż torch.compile, a złożone rdzenie są 92% szybsze.
Ogólnie 96,8% szybsze w porównaniu do torch.compile, znacznie przewyższając Claude Opus 4.5/Gemini 3 Pro (około 40%).
Prawdziwym ograniczeniem wydajności sprzętu AI jest zdolność do "odblokowywania oprogramowania + optymalizacji w zamkniętej pętli", a nie tylko sam chip.
W połączeniu z równolegle zachodzącym wydarzeniem Ane Apple: Apple M4 ANE: 6,6 TFLOPS/W (≈80 razy więcej niż A100), setki milionów urządzeń są nieużywane, a wąskim gardłem są zamknięte API + warstwy abstrakcji (CoreML tłumi 2–4 razy przepustowość).
NVIDIA GPU: Agent RL nauczył się "ekstremalnej optymalizacji w oparciu o rzeczywistą informację zwrotną z sprzętu", udowadniając, że wyuczone strategie mogą pokonać statyczne zasady.
Mur ochronny wydajności sprzętu (Apple/NVIDIA) jest obecnie niszczony przez AI "inżynierię wsteczną + optymalizację RL" — pierwsze otwiera zamknięte API, przekształcając nieużywane chipy w farmy obliczeniowe, a drugie wykorzystuje uczenie przez wzmocnienie, aby wycisnąć każdą kroplę wydajności z istniejących GPU. W przyszłości nie to sprzęt obliczeniowy będzie wąskim gardłem, ale to, kto pierwszy opanuje "sprzętową informację zwrotną + autonomiczną optymalizację" w zamkniętej pętli, łącząc oprogramowanie i sprzęt, kto potrafi podwoić wydajność istniejących urządzeń, ten krok po kroku zburzy mury gigantów. Tego rodzaju wzrost złożony stworzy prędkości, które będą trudne do dostrzegania przez ludzką intuicję: w ciągu kilku lat można przejść od 10-krotnego wzrostu do 100-krotnego → 1,000-krotnego.
Era treningu na urządzeniu (strona ANE) + ekstremalnego wnioskowania w chmurze/na krawędzi (strona CUDA Agent) przyspiesza, AI samodzielnie "optymalizuje się" do blisko teoretycznego szczytu. Setki milionów nieużywanych urządzeń Apple + ogromny potencjał kart NVIDIA są obecnie otwierane przez niezależnych hakerów/firmy/badaczy.


Najlepsze
Ranking
Ulubione
