Inception Labs đã ra mắt Mercury 2, thế hệ tiếp theo của Diffusion LLM sẵn sàng cho sản xuất. Mercury 2 đạt >1.000 token đầu ra/s với những cải tiến đáng kể về trí tuệ Diffusion LLM của @_inception_ai (“dLLMs”) sử dụng một kiến trúc khác so với các LLM dựa trên autoregressive. Quy trình tạo ra Diffusion LLM bắt đầu với tiếng ồn và tinh chỉnh đầu ra theo từng bước bằng cách sử dụng một mô hình transformer có thể sửa đổi nhiều token song song. Điều này cho phép song song hóa việc tạo ra token đầu ra, cho phép tốc độ đầu ra nhanh hơn vì nhiều token đầu ra được tạo ra cùng một lúc. Những điểm chính: ➤ Trong số các mô hình có kích thước/giá cả tương đương, Mercury 2 hoạt động cạnh tranh về trí tuệ so với tốc độ đầu ra. Mặc dù nó không có trí tuệ hàng đầu, nhưng tốc độ đầu ra của nó nhanh hơn hơn 3 lần so với mô hình nhanh nhất tiếp theo trong lớp này (các chỉ số dựa trên các điểm cuối của bên thứ nhất hoặc trung bình của các nhà cung cấp phục vụ mô hình khi không có điểm cuối của bên thứ nhất) ➤ Những điểm mạnh chính bao gồm lập trình agentic & sử dụng terminal và tuân theo hướng dẫn. Mercury 2 hoạt động ở mức tương tự như Claude 4.5 Haiku trên Terminal-Bench Hard và đạt 70% trên IFBench (Tuân theo Hướng dẫn), vượt trội hơn gpt-oss-120B, GPT-5.1 Codex mini và GPT-5 nano Thông tin nền tảng về Inception Labs: Đây là lần phát hành thứ hai từ Inception Labs. Các nhà sáng lập trước đây là giáo sư từ Stanford, UCLA và Cornell và đã đóng góp cho nghiên cứu & công nghệ AI bao gồm Flash Attention, Decision Transformers và Tối ưu hóa Sở thích Trực tiếp (DPO). Xem bên dưới để phân tích thêm.
So sánh tốc độ đầu ra với các mô hình khác (các chỉ số dựa trên các điểm cuối của bên thứ nhất hoặc trung vị của các nhà cung cấp phục vụ mô hình khi không có điểm cuối của bên thứ nhất)
Mercury 2 hoạt động tốt hơn so với các mẫu nhỏ tương đương trong một số đánh giá tác động bao gồm GDPval-AA, Terminal-Bench Hard và 𝜏²-Bench Telecom, trong khi vẫn cung cấp tốc độ đầu ra cao.
Xem Phân tích Nhân tạo để biết thêm chi tiết và tiêu chuẩn của Mercury 2:
11,34K