Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Inception Labs запустила Mercury 2 — свою наступне покоління готового до виробництва Diffusion LLM. Mercury 2 досягає >1 000 вихідних токенів/с із значним зростанням інтелекту
Дифузійні LLM («dLLMs») від @_inception_ai використовують іншу архітектуру порівняно з авторегресивними LLM. Процес генерації дифузійного LLM починається з шуму і ітеративно уточнює вихід за допомогою моделі трансформатора, яка може модифікувати кілька токенів паралельно. Це дозволяє паралелізувати генерацію вихідних токенів, що дозволяє швидше виводити швидкість, оскільки одночасно генерується багато вихідних токенів.
Основні висновки:
➤ Серед моделей, порівнянних за розміром/ціною, Mercury 2 демонструє конкурентоспроможні показники за інтелектом і швидкістю вихідної продукції. Хоча він не має провідного інтелекту, його швидкість виводу більш ніж у 3 рази вища за наступною за швидкістю моделлю в цьому класі (бенчмарки на основі сторонніх кінцевих точок або медіана постачальників, які обслуговують модель, де стороння кінцева точка недоступна)
➤ Ключові переваги включають агентне кодування, використання терміналів і виконання інструкцій. Mercury 2 працює на подібному рівні до Claude 4.5 Haiku на Terminal-Bench Hard і набирає 70% на IFBench (Instruction Follow), перевершуючи gpt-oss-120B, GPT-5.1 Codex mini та GPT-5 nano
Історія Inception Labs:
Це другий реліз від Inception Labs. Засновники раніше були професорами Стенфорда, UCLA та Корнелла, а також зробили внесок у дослідження та технології ШІ, зокрема Flash Attention, Decision Transformers та Direct Preference Optimization (DPO).
Дивіться нижче для подальшого аналізу.

Порівняння швидкості виводу з іншими моделями (бенчмарки на основі сторонніх кінцевих пристроїв або медіани постачальників, які обслуговують модель, де стороння кінцева точка недоступна)


Mercury 2 показує кращі показники порівняно з малими аналогічними моделями за кількома агентними оцінками, включно з GDPval-AA, Terminal-Bench Hard та τ²-Bench Telecom, при цьому забезпечуючи високі вихідні швидкості

Див. Штучний аналіз для детальнішої інформації та бенчмарків Mercury 2:
11,32K
Найкращі
Рейтинг
Вибране
