يعد CUDA Agent أول نموذج معروف مدرب بالتعلم المعزز يتفوق على كلود أوبوس 4.5 (وجيميني 3 برو) في توليد نواة CUDA! يستخدم وكيل CUDA من ByteDance **التعلم المعزز الوكئي** لتدريب نموذج يولد تلقائيا نوى CUDA عالية الأداء، مما يكافئ مباشرة بسرعة ملف تعريف حقيقية لوحدة معالجة الرسومات — متبتعد عن الأساليب التقليدية. بيانات المعيار الرئيسية على KernelBench: - النوى البسيطة/المتوسطة (المستوى 1/2): **100٪** أسرع من torch.compile - النوى المعقدة (المستوى 3): **92٪** معدل أسرع - بشكل عام: **96.8٪** معدل أسرع مقارنة ب torch.compile، مع متوسط تسريع هندسي ~2.11× - يتفوق على أقوى النماذج المملوكة مثل Claude Opus 4.5 وGemini 3 Pro بحوالي **40٪** في أصعب مهام المستوى الثالث (حيث تتفوق تلك النماذج فقط على torch.compile ~66–69٪ من الوقت) السقف الحقيقي لأجهزة الذكاء الاصطناعي ليس السيليكون نفسه—بل هو قدرة "**فتح البرمجيات + التحسين المغلق**". وبالجمع بين ذلك واختراق Apple ANE المتزامن: - Apple M4 ANE: **6.6 TFLOPS/W** (~80× أكثر كفاءة من A100)، مع مئات الملايين من الأجهزة الخاملة؛ عنق الزجاجة هو واجهات برمجة التطبيقات المغلقة من آبل + طبقات التجريد (CoreML يخفي 2–4× معدل النقل الحقيقي) - وحدات معالجة رسومات NVIDIA: يتعلم وكلاء التعلم المعزز "**تحسين شديد تحت تغذية راجعة الأجهزة الحقيقية**"، مما يثبت أن الاستراتيجيات المكتسبة يمكنها سحق القواعد/المترجمات الثابتة تتعرض مستويات الأداء لعمالقة الأجهزة (آبل/NVIDIA) إلى القتل المزدوج بواسطة الذكاء الاصطناعي: الهندسة العكسية تحطم واجهات برمجة التطبيقات المغلقة (تحول الشرائح الخاملة إلى مزارع حوسبة)، بينما التعلم المعزز يستخرج كل قطرة من وحدات معالجة الرسومات الموجودة. في المستقبل، لن تكون نقطة الاختناق الحقيقية هي أجهزة الحوسبة—بل من يتقن الحلقة المغلقة "**تغذية راجعة الأجهزة الأصلية + تحسين التعلم الذاتي**" أولا. من خلال دمج التكتيكات اللينة والصلبة، من يقلب أداء الأجهزة الحالية 2× أو 10× أو أكثر يمكنه تفكيك جدران العمالقة تدريجيا. هذا النمو المركب يخلق سرعات تتجاوز الحدس البشري: من 10× → إلى 100× → 1000× خلال بضع سنوات. عصر **التدريب على الجهاز** (جانب ANE) + **الاستدلال السحابي/الحافة** (جانب وكيل CUDA) يتسارع بسرعة. يمكن للذكاء الاصطناعي الآن "**تحسين ذاتي**" بالقرب من القمم النظرية. الإمكانات غير المستغلة في مئات الملايين من أجهزة آبل الخمولة + بطاقات NVIDIA الضخمة يتم إطلاقها بشكل جماعي من قبل القراصنة المستقلين والشركات والباحثين.