DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

Ramin Hasani

Her zamanki gibi Qwen ekibinden hibrit minik modellerin gerçekten etkileyici bir gösterimi! İnsanlar, cihaz içi dağıtımda hız, gecikme ve bellek açısından @liquidai'nin LFM'leriyle nasıl karşılaştırıldıklarını soruyor. İşte Apple M3 Ultra hakkında hızlı bir profil değerlendirmesi: > LFM2.5-1.2B, Qwen3.5-0.8B'den %52 daha hızlı kod çözme özelliğine sahiptir. > LFM2-700M, kod çözmede Qwen3.5-0.8B'den %71 daha hızlıdır > LFM2-2.6B, kodlama sırasında Qwen3.5-2B ile aynı hıza sahiptir > LFM2-700M, Qwen3.5-0.8B'ye göre %46 daha az zirve bellek kullanır > LFM2-2.6B, Qwen3.5-2B'ye göre %21 daha az zirve bellek kullanır > aynı parametre boyutuna sahip lfms ön doldurma genellikle Qwen3.5'ten %12 daha hızlıdır LFM2 serisini, bir işlemci için kalite ödün vermeden en verimli mimariyi bulmamızı sağlayan donanım-döngü meta yapay zeka tasarım yaklaşımımızla tasarladık. Bu test Apple M3 Ultra ile yapılıyor, 512 GB birleşik bellek Yapılandırma: > 512 prompt token, 128 nesil token, > Konfigürasyon başına 5 deneme > Çerçevesi: MLX (mlx-lm / mlx-vlm)

En İyiler

Sıralama

Takip Listesi