Apple vient de lancer le MacBook Pro M5 Max et c'est une centrale AI. 4x plus rapide en calcul AI par rapport au M4 Max. Ces spécifications sont folles : - CPU 18 cœurs avec 6 "super cœurs" = le cœur de CPU le plus rapide au monde - GPU 40 cœurs = rivalise avec un RTX 4070 dans un ordinateur portable - 128 Go de mémoire unifiée = plus que la plupart des serveurs - 614 Go/s de bande passante = 4x ce qu'un DGX Spark obtient - Autonomie de 24 heures Vous pouvez maintenant exécuter Llama 70B, un modèle qui nécessitait un cluster GPU de 40 000 $ il y a 18 mois, sur un ordinateur portable dans votre café local. À ~20-30 tokens/sec, c'est assez rapide pour être réellement utilisé. La révolution de l'"AI locale" vient d'être lancée pour 3 499 $.