A Inception Labs lançou o Mercury 2, seu LLM Diffusion de próxima geração pronto para produção. O Mercury 2 alcança >1.000 tokens de saída/s com ganhos significativos em inteligência Os LLMs de Difusão ("dLLMs") da @_inception_ai utilizam uma arquitetura diferente em comparação com os LLMs baseados em autoregressivo. O processo de geração de LLM por difusão começa com ruído e refina iterativamente a saída usando um modelo de transformador que pode modificar múltiplos tokens em paralelo. Isso permite a paralelização da geração de tokens de saída, possibilitando velocidades de saída mais rápidas porque muitos tokens de saída são gerados ao mesmo tempo. Principais lições: ➤ Entre modelos de tamanho/preço comparáveis, o Mercury 2 tem desempenho competitivo em inteligência versus velocidade de saída. Embora não tenha inteligência líder, sua velocidade de saída é mais de 3 vezes superior ao modelo seguinte mais rápido dessa classe (benchmarks baseados em endpoints de primeira mão ou na mediana dos provedores que atendem ao modelo onde um endpoint de primeira parte não está disponível) ➤ Os principais pontos fortes incluem codificação agente, uso terminal e acompanhamento de instruções. Mercury 2 tem desempenho semelhante ao Claude 4.5 Haiku no Terminal-Bench Hard e obtém 70% em IFBench (Instruction Following), superando gpt-oss-120B, GPT-5.1 Codex mini e GPT-5 nano Histórico do Inception Labs: Este é o segundo lançamento da Inception Labs. Os fundadores foram anteriormente professores de Stanford, UCLA e Cornell e contribuíram para pesquisas e tecnologias em IA, incluindo Atenção Rápida, Transformadores de Decisão e Otimização de Preferências Diretas (DPO). Veja abaixo para uma análise mais aprofundada.
Comparação de velocidade de saída com outros modelos (benchmarks baseados em endpoints de primeira parte ou na mediana dos provedores que atendem ao modelo onde um endpoint de primeira parte não está disponível)
O Mercury 2 tem desempenho acima do par em comparação com modelos pequenos comparáveis em várias avaliações agenticas, incluindo GDPval-AA, Terminal-Bench Hard e τ²-Bench Telecom, além de oferecer altas velocidades de saída
Veja Análise Artificial para mais detalhes e referências do Mercúrio 2:
11,32K