DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Inception Labs telah meluncurkan Mercury 2, LLM Difusi siap produksi generasi berikutnya. Mercury 2 mencapai >1.000 token keluaran dengan keuntungan yang signifikan dalam kecerdasan LLM Difusi @_inception_ai ("dLLM") menggunakan arsitektur yang berbeda dibandingkan dengan LLM berbasis autoregresif. Proses pembuatan LLM Difusi dimulai dengan noise dan secara berulang menyempurnakan output menggunakan model transformator yang dapat memodifikasi beberapa token secara paralel. Hal ini memungkinkan paralelisasi pembuatan token keluaran, memungkinkan kecepatan keluaran yang lebih cepat karena banyak token keluaran dihasilkan secara bersamaan. Kesimpulan utama: ➤ Di antara model ukuran/kelas harga yang sebanding, Mercury 2 berkinerja kompetitif dalam kecepatan kecerdasan vs. output. Meskipun tidak memiliki kecerdasan terkemuka, kecepatan outputnya lebih dari 3X model tercepat berikutnya di kelas ini (tolok ukur berdasarkan titik akhir pihak pertama atau median penyedia yang melayani model di mana titik akhir pihak pertama tidak tersedia) ➤ Kekuatan utama termasuk pengkodean agen & penggunaan terminal dan instruksi berikut. Mercury 2 berkinerja pada level yang mirip dengan Claude 4.5 Haiku di Terminal-Bench Hard dan skor 70% pada IFBench (Instruction Following), mengungguli gpt-oss-120B, GPT-5.1 Codex mini, dan GPT-5 nano Latar belakang Inception Labs: Ini adalah rilis kedua dari Inception Labs. Para pendiri sebelumnya adalah profesor dari Stanford, UCLA, dan Cornell dan telah berkontribusi pada penelitian & teknologi AI termasuk Flash Attention, Decision Transformers, dan Direct Preference Optimization (DPO). Lihat di bawah untuk analisis lebih lanjut.

Perbandingan kecepatan output dengan model lain (tolok ukur berdasarkan titik akhir pihak pertama atau median penyedia yang melayani model di mana titik akhir pihak pertama tidak tersedia)

Mercury 2 berkinerja di atas standar dibandingkan dengan model kecil yang sebanding pada beberapa evaluasi agen termasuk GDPval-AA, Terminal-Bench Hard, dan τ²-Bench Telecom, sambil menawarkan kecepatan keluarannya yang tinggi

Lihat Analisis Buatan untuk detail dan tolok ukur lebih lanjut tentang Merkurius 2:

11,32K

Teratas

Peringkat

Favorit