Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

CUDA-Agent — це перша відома модель навчання RL, яка перевершує Claude Opus-4.6 та Gemini 3 Pro у генерації ядра CUDA! CUDA Agent використовує agentic RL для навчання моделей автоматичній генерації високопродуктивних CUDA-ядер, безпосередньо використовуючи реальну швидкість профілювання GPU як сигнал винагороди, порушуючи шаблон Ознайомтеся з наступними даними: Бенчмарк KernelBench: прості/середні ядра на 100% швидші за torch.compile, складні ядра — на 92% швидші Загалом швидкість на 96,8% швидша порівняно з torch.compile, значно краще, ніж у Claude Opus 4.5/Gemini 3 Pro (близько 40%) Справжня стеля апаратного забезпечення ШІ — це можливість «програмно розблокувати + оптимізувати замкнений цикл», а не лише сам чіп. У поєднанні з одночасною подією Apple Ane: Apple M4 ANE: 6,6 TFLOPS/W (у 80 разів більше, ніж у ≈ A100), сотні мільйонів пристроїв залишаються без активності, а вузьким місцем є закритий API + рівень абстракції (CoreML щити у 2–4 рази більшу пропускну здатність) NVIDIA GPU: RL Agent вивчає «остаточну оптимізацію з реальним апаратним зворотним зв'язком», доводячи, що набуття стратегія може перемогти статичні правила Обмеження продуктивності апаратного забезпечення (Apple/Nvidia) знищується через штучний інтелект «зворотного інжинірингу + оптимізація RL»: перший розбиває закриті API, щоб перетворити неактивні чипи на обчислювальні потужні ферми, а другий використовує підкріплене навчання, щоб витиснути кожну краплю продуктивності існуючих GPU. У майбутньому застрягне не обчислювальне обладнання, а той, хто першим опановує замкнутий цикл «апаратного зворотного зв'язку + оптимізації незалежного навчання», як м'якого, так і жорсткого, і хто може подвоїти продуктивність існуючого обладнання, може крок за кроком зламати стіну гігантів. Цей складений ріст створює швидкість, яку важко сприймати людською інтуїцією: від 10x до 100x → 1000x за кілька років Епоха навчання на пристрої (сторона ANE) + екстремальне висновки хмари/периферії (сторона агента CUDA) прискорилася, і сам ШІ може «самооптимізувати» до наближення до теоретичного піку. Потенціал сотень мільйонів неактивних пристроїв Apple + величезних карт NVIDIA колективно відкривається незалежними/корпоративними хакерами та дослідниками.

Найкращі

Рейтинг

Вибране