Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
CUDA Agent, CUDA çekirdeği üretiminde Claude Opus 4.5'i (ve Gemini 3 Pro) geçen bilinen ilk RL eğitimli modeldir!
ByteDance'in CUDA Ajanı, otomatik olarak yüksek performanslı CUDA çekirdekleri üreten bir modeli eğitmek için **ajanik pekiştirme öğrenme** kullanır ve doğrudan gerçek GPU profilleme hızıyla ödüllendirir—geleneksel yaklaşımlardan kopar.
KernelBench hakkında önemli kıyaslama verileri:
- Basit/orta çekirdekler (Seviye-1/2): torch.compile'den **%100** daha hızlı
- Karmaşık çekirdekler (Seviye-3): **%92** daha hızlı hız
- Genel olarak: **%96,8** torch.compile'a göre daha hızlı hız, ~2,11× geometrik ortalama hızlanma ile
- Claude Opus 4.5 ve Gemini 3 Pro gibi en güçlü özel modelleri yaklaşık %40** geride bırakır (bu modeller sadece torch.compile'ı ~%66–69 oranında geçer)
Yapay zeka donanımının gerçek tavanı silikon kendisi değil—"**yazılım kilidini açma + optimizasyon kapalı döngü**" yeteneğidir.
Bunu Apple ANE'in eşzamanlı çıkışıyla birleştirirsek:
- Apple M4 ANE: **6.6 TFLOPS/W** (~80× A100'den daha verimli), yüz milyonlarca cihaz boş duruyor; darboğaz Apple'ın kapalı API'leri + soyutlama katmanlarıdır (CoreML 2–4× gerçek veri verimini gizler)
- NVIDIA GPU'lar: RL ajanları "**gerçek donanım geri bildirimi altında aşırı optimizasyonu**" öğrenir ve öğrenilen stratejilerin statik kuralları/derleyicileri ezebileceğini kanıtlayır
Donanım devlerinin (Apple/NVIDIA) performans hendekleri yapay zeka tarafından **iki kat yok ediliyor**: ters mühendislik yaparak kapalı API'leri parçalıyor (boşta kalan çipleri hesaplama çiftliklerine dönüştürüyor), gerçek gerçek sistem ise mevcut GPU'lardan son damlayı bile alıyor.
Gelecekte asıl dar nokta hesaplama donanımı olmayacak—"**donanım-yerel geri bildirim + otonom öğrenme optimizasyonu**" kapalı döngüsünü ilk kim ustalaşacak. Yumuşak ve sert taktikleri birleştirerek, mevcut cihaz performansını 2×, 10× veya daha fazla değiştiren devlerin duvarlarını aşamalı olarak yıkabilir. Bu bileşik büyüme, insan sezgisinin ötesinde hızlar yaratır: birkaç yıl içinde 10× →dan 100× → 1.000× hızlara.
**Cihaz üzerinde eğitim** (ANE tarafı) + **bulut/kenar aşırı çıkarım** (CUDA Ajan tarafı) dönemi hızla hızlanıyor. Yapay zeka artık teorik zirvelere yakın "**kendini optimize edebiliyor". Yüz milyonlarca boşta kalan Apple cihazının + devasa NVIDIA kartlarının keşfedilmemiş potansiyeli, bağımsız hackerlar, şirketler ve araştırmacılar tarafından topluca açılıyor.


En İyiler
Sıralama
Takip Listesi
