Inception Labs uvedla na trh Mercury 2, svou novou generaci produkčně připraveného Diffusion LLM. Mercury 2 dosahuje >1 000 výstupních tokenů/s s výrazným nárůstem inteligence Difuzní LLM ("dLLM") od @_inception_ai používají odlišnou architekturu než LLM založené na autoregresi. Proces generování LLM v Diffusion začíná šumem a iterativně upravuje výstup pomocí transformátorového modelu, který může paralelně upravovat více tokenů. To umožňuje paralelizaci generování výstupních tokenů, což umožňuje rychlejší výstupní rychlosti, protože mnoho výstupních tokenů je generováno současně. Hlavní poznatky: ➤ Mezi modely srovnatelné velikosti a cenové třídy si Mercury 2 vede konkurenceschopně v poměru inteligence versus rychlosti výstupu. I když nemá špičkovou inteligenci, jeho výstupní rychlost je více než třikrát rychlejší oproti dalšímu nejrychlejšímu modelu v této kategorii (benchmarky založené na koncových bodech první strany nebo mediánu poskytovatelů obsluhujících model, kde není dostupný koncový bod první strany) ➤ Klíčové silné stránky zahrnují agentické kódování, použití terminálu a sledování instrukcí. Mercury 2 dosahuje podobných výsledků jako Claude 4.5 Haiku na Terminal-Bench Hard a dosahuje 70 % na IFBench (Instruction Following), překonává GPT-OSS-120B, GPT-5.1 Codex mini a GPT-5 nano Pozadí Inception Labs: Toto je druhé vydání od Inception Labs. Zakladatelé byli dříve profesoři ze Stanfordu, UCLA a Cornell a přispěli k výzkumu a technologiím AI včetně Flash Attention, Decision Transformers a Direct Preference Optimization (DPO). Další analýzu naleznete níže.
Porovnání rychlosti výstupu s jinými modely (benchmarky založené na koncových bodech první strany nebo mediánu poskytovatelů obsluhujících model, kde není dostupný koncový bod první strany)
Mercury 2 dosahuje nadprůměrných výsledků ve srovnání s malými srovnatelnými modely v několika agentických hodnoceních včetně GDPval-AA, Terminal-Bench Hard a τ²-Bench Telecom, přičemž nabízí vysoké výstupní rychlosti
Podrobnosti a benchmarky Mercury 2 najdete v článku Artificial Analysis:
11,3K