DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Der CUDA-Agent ist das erste bekannte RL-Trainingsmodell, das in der Generierung von CUDA-Kernen Claude Opus-4.6 und Gemini 3 Pro übertroffen hat! Der CUDA-Agent verwendet agentisches RL, um automatisch leistungsstarke CUDA-Kerne zu generieren, wobei die tatsächliche GPU-Profiling-Geschwindigkeit als Belohnungssignal dient und die Konventionen durchbricht. Schauen Sie sich die folgenden Daten an: KernelBench-Benchmark: Einfache/mittlere Kerne sind 100 % schneller als torch.compile, komplexe Kerne 92 % schneller. Insgesamt 96,8 % schneller im Vergleich zu torch.compile, weit über Claude Opus 4.5/Gemini 3 Pro (ca. 40 %). Die wahre Obergrenze der AI-Hardware ist die Fähigkeit zur "Softwarefreischaltung + Optimierungsschleife" und nicht nur der Chip selbst. In Verbindung mit dem gleichzeitig stattfindenden Apple ANE-Ereignis: Apple M4 ANE: 6,6 TFLOPS/W (≈80-mal so viel wie A100), Hunderte Millionen Geräte sind ungenutzt, der Flaschenhals sind geschlossene APIs + Abstraktionsschichten (CoreML maskiert 2–4-fache Durchsatzrate). NVIDIA GPU: Der RL-Agent hat "extreme Optimierungen unter echtem Hardware-Feedback" gelernt und bewiesen, dass die erlernten Strategien statische Regeln übertreffen können. Die Leistungsmauer der Hardware (Apple/NVIDIA) wird durch die "Reverse Engineering + RL-Optimierung" von AI doppelt angegriffen – erstere sprengt geschlossene APIs und verwandelt ungenutzte Chips in Rechenleistung-Farmen, letztere nutzt Reinforcement Learning, um jede Leistung aus bestehenden GPUs herauszuholen. In Zukunft wird nicht die Rechenleistung der Flaschenhals sein, sondern wer zuerst den "Hardware-nativen Feedback + selbstlernenden Optimierungs"-Kreislauf beherrscht, sowohl Software als auch Hardware kombiniert, wer die Leistung bestehender Geräte verdoppeln kann, wird Schritt für Schritt die Mauern der Giganten durchbrechen. Dieses hybride Wachstum wird Geschwindigkeiten erzeugen, die für den Menschen schwer zu erkennen sind: innerhalb von Jahren von 10-fach auf 100-fach → 1.000-fach. Die Ära des on-device Trainings (ANE-Seite) + extremen Inferenz in der Cloud/Edge (CUDA-Agent-Seite) beschleunigt sich, AI kann sich selbst "optimieren" und sich der theoretischen Spitze annähern. Hunderte Millionen ungenutzte Apple-Geräte + das Potenzial von massiven NVIDIA-Karten werden kollektiv von unabhängigen Hackern/Firmen/Forschern aufgebrochen.

Top

Ranking

Favoriten