أطلقت شركة Inception Labs نموذج Mercury 2، وهو نموذج الانتشار الكبير الجاهز للإنتاج من الجيل القادم. حقق ميركوري 2 >1,000 رمز إخراج في الثانية مع مكاسب كبيرة في الذكاء تستخدم نماذج الانتشار الكبيرة ("dLLMs") في @_inception_ai بنية مختلفة مقارنة بالنماذج الذاتية المعتمدة على الانحدار. تبدأ عملية توليد نماذج اللغة الكبيرة في الانتشار بالضوضاء وتقوم بتحسين المخرج بشكل تكراري باستخدام نموذج محول يمكنه تعديل عدة رموز بالتوازي. هذا يسمح بالتوازي في توليد رموز الإخراج، مما يسمح بسرعات إخراج أسرع لأن العديد من رموز الإخراج يتم توليدها في نفس الوقت. أهم النقاط المستخلصة: ➤ من بين النماذج المماثلة من حيث الحجم/السعر، تقدم ميركوري 2 أداء تنافسيا في الذكاء مقابل سرعة الإخراج. على الرغم من أنه لا يمتلك ذكاء رائدا، إلا أن سرعة إخراجه تزيد عن 3 أضعاف أسرع نموذج في هذا الفئة (اختبارات مبنية على نقاط الطرف الأول أو متوسط عدد المزودين الذين يخدمون النموذج حيث لا تتوفر نقطة نهاية من الطرف الأول) ➤ تشمل نقاط القوة الرئيسية الترميز الوكيل واستخدام الطرفيات واتباع التعليمات. ميركوري 2 يؤدي بمستوى مشابه لهايكو كلود 4.5 على مستوى المحطة الصلبة ويحصل على 70٪ في IFBench (اتباع التعليمات)، متفوقا على GPT-OSS-120B وGPT-5.1 كودكس mini وGPT-5 nano خلفية مختبرات إنسيبشن: هذا هو الإصدار الثاني من Inception Labs. كان المؤسسون سابقا أساتذة من جامعات ستانفورد وجامعة كاليفورنيا في لوس أنجلوس وكورنيل، وساهموا في أبحاث وتقنيات الذكاء الاصطناعي بما في ذلك الانتباه السريع، ومحولات القرار، وتحسين التفضيل المباشر (DPO). انظر أدناه لمزيد من التحليل.
مقارنة سرعة الإخراج مع النماذج الأخرى (معايير مرجعية تعتمد على نقاط نهاية الطرف الأول أو متوسط عدد المزودين الذين يخدمون النموذج حيث لا تتوفر نقطة نهاية من الطرف الأول)
ميركوري 2 يؤدي أداء أعلى من المعدل مقارنة بالنماذج الصغيرة المماثلة في عدة تقييمات وكلاء مثل GDPval-AA، Terminal-Bench Hard، وτ²-Bench Telecom، مع تقديم سرعات إخراج عالية
انظر التحليل الاصطناعي لمزيد من التفاصيل والمعايير لعطارد 2:
‏‎11.31‏K