Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

CUDA-Agent jest pierwszym znanym modelem RL do treningu, który przewyższa Claude Opus-4.6 i Gemini 3 Pro w generowaniu rdzeni CUDA! CUDA Agent wykorzystuje model treningowy agentic RL do automatycznego generowania wysokowydajnych rdzeni CUDA, bezpośrednio używając rzeczywistej prędkości profilowania GPU jako sygnału nagrody, łamiąc konwencje. Zobacz poniższe dane: Benchmark KernelBench: proste/średnie rdzenie są 100% szybsze niż torch.compile, a złożone rdzenie są 92% szybsze. Ogólnie 96,8% szybsze w porównaniu do torch.compile, znacznie przewyższając Claude Opus 4.5/Gemini 3 Pro (około 40%). Prawdziwym ograniczeniem wydajności sprzętu AI jest zdolność do "odblokowywania oprogramowania + optymalizacji w zamkniętej pętli", a nie tylko sam chip. W połączeniu z równolegle zachodzącym wydarzeniem Ane Apple: Apple M4 ANE: 6,6 TFLOPS/W (≈80 razy więcej niż A100), setki milionów urządzeń są nieużywane, a wąskim gardłem są zamknięte API + warstwy abstrakcji (CoreML tłumi 2–4 razy przepustowość). NVIDIA GPU: Agent RL nauczył się "ekstremalnej optymalizacji w oparciu o rzeczywistą informację zwrotną z sprzętu", udowadniając, że wyuczone strategie mogą pokonać statyczne zasady. Mur ochronny wydajności sprzętu (Apple/NVIDIA) jest obecnie niszczony przez AI "inżynierię wsteczną + optymalizację RL" — pierwsze otwiera zamknięte API, przekształcając nieużywane chipy w farmy obliczeniowe, a drugie wykorzystuje uczenie przez wzmocnienie, aby wycisnąć każdą kroplę wydajności z istniejących GPU. W przyszłości nie to sprzęt obliczeniowy będzie wąskim gardłem, ale to, kto pierwszy opanuje "sprzętową informację zwrotną + autonomiczną optymalizację" w zamkniętej pętli, łącząc oprogramowanie i sprzęt, kto potrafi podwoić wydajność istniejących urządzeń, ten krok po kroku zburzy mury gigantów. Tego rodzaju wzrost złożony stworzy prędkości, które będą trudne do dostrzegania przez ludzką intuicję: w ciągu kilku lat można przejść od 10-krotnego wzrostu do 100-krotnego → 1,000-krotnego. Era treningu na urządzeniu (strona ANE) + ekstremalnego wnioskowania w chmurze/na krawędzi (strona CUDA Agent) przyspiesza, AI samodzielnie "optymalizuje się" do blisko teoretycznego szczytu. Setki milionów nieużywanych urządzeń Apple + ogromny potencjał kart NVIDIA są obecnie otwierane przez niezależnych hakerów/firmy/badaczy.

Najlepsze

Ranking

Ulubione