Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Inception Labs uruchomiło Mercury 2, swoją gotową do produkcji, nowej generacji Diffusion LLM. Mercury 2 osiąga >1,000 tokenów wyjściowych/s z znacznymi zyskami w inteligencji dLLM-y Inception Labs („dLLMs”) używają innej architektury w porównaniu do LLM-ów opartych na autoregresji. Proces generacji Diffusion LLM zaczyna się od szumów i iteracyjnie udoskonala wyjście za pomocą modelu transformera, który może modyfikować wiele tokenów równolegle. Umożliwia to równoległe generowanie tokenów wyjściowych, co pozwala na szybsze prędkości wyjścia, ponieważ wiele tokenów wyjściowych jest generowanych jednocześnie. Kluczowe wnioski: ➤ Wśród modeli o porównywalnej wielkości/klasie cenowej, Mercury 2 wypada konkurencyjnie pod względem inteligencji w porównaniu do prędkości wyjścia. Chociaż nie ma wiodącej inteligencji, jego prędkość wyjścia jest ponad 3 razy szybsza niż w przypadku następnego najszybszego modelu w tej klasie (benchmarki oparte na punktach końcowych pierwszej strony lub medianie dostawców obsługujących model, gdzie punkt końcowy pierwszej strony nie jest dostępny) ➤ Kluczowe mocne strony to agentowe kodowanie i użycie terminala oraz przestrzeganie instrukcji. Mercury 2 osiąga podobny poziom do Claude 4.5 Haiku w Terminal-Bench Hard i zdobywa 70% w IFBench (Instruction Following), przewyższając gpt-oss-120B, GPT-5.1 Codex mini i GPT-5 nano Tło Inception Labs: To druga wersja od Inception Labs. Założyciele byli wcześniej profesorami na Stanfordzie, UCLA i Cornell i przyczynili się do badań i technologii AI, w tym Flash Attention, Decision Transformers i Direct Preference Optimization (DPO). Zobacz poniżej dalszą analizę.

Porównanie prędkości wyjściowej z innymi modelami (wskaźniki oparte na punktach końcowych pierwszej strony lub medianie dostawców obsługujących model, gdy punkt końcowy pierwszej strony nie jest dostępny)

Mercury 2 wypada lepiej w porównaniu do małych porównywalnych modeli w kilku ocenach agentowych, w tym GDPval-AA, Terminal-Bench Hard oraz 𝜏²-Bench Telecom, oferując jednocześnie wysokie prędkości wyjściowe.

Zobacz Analizę Sztuczną, aby uzyskać dalsze szczegóły i benchmarki Mercury 2:

11,33K

Najlepsze

Ranking

Ulubione