DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Inception Labs on lanseerannut Mercury 2:n, heidän seuraavan sukupolven tuotantovalmiin Diffusion LLM:n. Mercury 2 saavuttaa >1 000 tuotostokenia/s merkittävillä älykkyysparannuksilla @_inception_ai:n diffuusio-LLM:t ("dLLM:t") käyttävät erilaista arkkitehtuuria verrattuna autoregressiivisiin LLM:iin. Diffusion LLM:n generointiprosessi alkaa kohinalla ja tarkentaa lähtöä iteratiivisesti muuntajamallilla, joka voi muokata useita tokeneita rinnakkain. Tämä mahdollistaa ulostulotokenien rinnakkaisuuden, mikä mahdollistaa nopeammat lähtönopeudet, koska useita ulostulotokeneita tuotetaan samanaikaisesti. Tärkeimmät huomiot: ➤ Vertailukelpoisten kokoisten ja hintaluokkien joukossa Mercury 2 pärjää älykkyydessä ja lähtönopeudessa. Vaikka sillä ei ole johtavaa älykkyyttä, sen lähtönopeus on yli 3 kertaa seuraavaksi nopein malli tässä luokassa (benchmarkit, jotka perustuvat ensimmäisen osapuolen päätepisteisiin tai niiden palveluntarjoajien mediaaniin, joissa ensimmäisen osapuolen päätepiste ei ole saatavilla) ➤ Keskeisiä vahvuuksia ovat agenttikoodaus, terminaalien käyttö ja ohjeiden noudattaminen. Mercury 2 suoriutuu Terminal-Bench Hard -vaikeudella samalla tasolla kuin Claude 4.5 Haiku ja saa 70 % IFBenchissä (Instruction Following), päihittää gpt-oss-120B:n, GPT-5.1 Codex minin ja GPT-5 nano:n Inception Labsin tausta: Tämä on toinen julkaisu Inception Labsilta. Perustajat olivat aiemmin professoreita Stanfordista, UCLA:sta ja Cornellista, ja he ovat osallistuneet tekoälytutkimukseen ja teknologioihin, kuten Flash Attention, Decision Transformers ja Direct Preference Optimization (DPO). Katso alta lisäanalyysi.

Tulostusnopeuden vertailu muihin malleihin (benchmarkit, jotka perustuvat ensimmäisen osapuolen päätepisteisiin tai mallia palvelevien palveluntarjoajien mediaaniin, joissa ensimmäisen osapuolen päätepiste ei ole saatavilla)

Mercury 2 suoriutuu paremmin kuin pienet vertailumallit useissa agenttiarvioinneissa, kuten GDPval-AA, Terminal-Bench Hard ja τ²-Bench Telecom, ja tarjoaa samalla korkeat lähtönopeudet

Katso Artificial Analysis saadaksesi lisätietoja ja vertailuarvoja Mercury 2:sta:

11,31K

Johtavat

Rankkaus

Suosikit