Inception Labs a lansat Mercury 2, următoarea lor generație de Diffusion LLM, gata de producție. Mercury 2 atinge >1.000 de tokenuri de ieșire/s cu creșteri semnificative în inteligență LLM-urile Diffusion ("dLLM-uri") ale @_inception_ai folosesc o arhitectură diferită comparativ cu LLM-urile bazate pe autoregresivă. Procesul de generare a LLM-urilor prin difuzie începe cu zgomot și rafinează iterativ ieșirea folosind un model de transformator care poate modifica mai multe jetoane în paralel. Aceasta permite paralelizarea generării tokenurilor de ieșire, permițând viteze de ieșire mai rapide deoarece multe tokenuri de ieșire sunt generate simultan. Concluzii cheie: ➤ Dintre modelele de dimensiuni/preț comparabile, Mercury 2 performează competitiv la inteligență vs. viteză de ieșire. Deși nu are inteligență de top, viteza sa de ieșire este de peste 3 ori mai rapidă decât următorul model din această clasă (benchmark-uri bazate pe endpoint-urile first-party sau mediana furnizorilor care servesc modelul acolo unde un endpoint first party nu este disponibil) ➤ Punctele forte cheie includ codificarea agentică și utilizarea terminalului și urmărirea instrucțiunilor. Mercury 2 performează la un nivel similar cu Claude 4.5 Haiku pe Terminal-Bench Hard și obține 70% la IFBench (Instruction Following), depășind gpt-oss-120B, GPT-5.1 Codex mini și GPT-5 nano Contextul Inception Labs: Aceasta este a doua versiune a Inception Labs. Fondatorii au fost anterior profesori de la Stanford, UCLA și Cornell și au contribuit la cercetare și tehnologii AI precum Flash Attention, Decision Transformers și Direct Preference Optimization (DPO). Vezi mai jos pentru analize suplimentare.
Compararea vitezei de ieșire cu alte modele (benchmark-uri bazate pe endpoint-urile first-party sau mediana furnizorilor care servesc modelul acolo unde un endpoint first party nu este disponibil)
Mercury 2 performează peste așteptări comparativ cu modelele mici comparabile la mai multe evaluări agentice, inclusiv GDPval-AA, Terminal-Bench Hard și τ²-Bench Telecom, oferind în același timp viteze ridicate de ieșire
Vezi Analiza Artificială pentru detalii suplimentare și repere ale lui Mercur 2:
11,34K