CUDA Agent, CUDA çekirdeği üretiminde Claude Opus 4.5'i (ve Gemini 3 Pro) geçen bilinen ilk RL eğitimli modeldir! ByteDance'in CUDA Ajanı, otomatik olarak yüksek performanslı CUDA çekirdekleri üreten bir modeli eğitmek için **ajanik pekiştirme öğrenme** kullanır ve doğrudan gerçek GPU profilleme hızıyla ödüllendirir—geleneksel yaklaşımlardan kopar. KernelBench hakkında önemli kıyaslama verileri: - Basit/orta çekirdekler (Seviye-1/2): torch.compile'den **%100** daha hızlı - Karmaşık çekirdekler (Seviye-3): **%92** daha hızlı hız - Genel olarak: **%96,8** torch.compile'a göre daha hızlı hız, ~2,11× geometrik ortalama hızlanma ile - Claude Opus 4.5 ve Gemini 3 Pro gibi en güçlü özel modelleri yaklaşık %40** geride bırakır (bu modeller sadece torch.compile'ı ~%66–69 oranında geçer) Yapay zeka donanımının gerçek tavanı silikon kendisi değil—"**yazılım kilidini açma + optimizasyon kapalı döngü**" yeteneğidir. Bunu Apple ANE'in eşzamanlı çıkışıyla birleştirirsek: - Apple M4 ANE: **6.6 TFLOPS/W** (~80× A100'den daha verimli), yüz milyonlarca cihaz boş duruyor; darboğaz Apple'ın kapalı API'leri + soyutlama katmanlarıdır (CoreML 2–4× gerçek veri verimini gizler) - NVIDIA GPU'lar: RL ajanları "**gerçek donanım geri bildirimi altında aşırı optimizasyonu**" öğrenir ve öğrenilen stratejilerin statik kuralları/derleyicileri ezebileceğini kanıtlayır Donanım devlerinin (Apple/NVIDIA) performans hendekleri yapay zeka tarafından **iki kat yok ediliyor**: ters mühendislik yaparak kapalı API'leri parçalıyor (boşta kalan çipleri hesaplama çiftliklerine dönüştürüyor), gerçek gerçek sistem ise mevcut GPU'lardan son damlayı bile alıyor. Gelecekte asıl dar nokta hesaplama donanımı olmayacak—"**donanım-yerel geri bildirim + otonom öğrenme optimizasyonu**" kapalı döngüsünü ilk kim ustalaşacak. Yumuşak ve sert taktikleri birleştirerek, mevcut cihaz performansını 2×, 10× veya daha fazla değiştiren devlerin duvarlarını aşamalı olarak yıkabilir. Bu bileşik büyüme, insan sezgisinin ötesinde hızlar yaratır: birkaç yıl içinde 10× →dan 100× → 1.000× hızlara. **Cihaz üzerinde eğitim** (ANE tarafı) + **bulut/kenar aşırı çıkarım** (CUDA Ajan tarafı) dönemi hızla hızlanıyor. Yapay zeka artık teorik zirvelere yakın "**kendini optimize edebiliyor". Yüz milyonlarca boşta kalan Apple cihazının + devasa NVIDIA kartlarının keşfedilmemiş potansiyeli, bağımsız hackerlar, şirketler ve araştırmacılar tarafından topluca açılıyor.