Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
CUDA-Agent — це перша відома модель навчання RL, яка перевершує Claude Opus-4.6 та Gemini 3 Pro у генерації ядра CUDA!
CUDA Agent використовує agentic RL для навчання моделей автоматичній генерації високопродуктивних CUDA-ядер, безпосередньо використовуючи реальну швидкість профілювання GPU як сигнал винагороди, порушуючи шаблон
Ознайомтеся з наступними даними:
Бенчмарк KernelBench: прості/середні ядра на 100% швидші за torch.compile, складні ядра — на 92% швидші
Загалом швидкість на 96,8% швидша порівняно з torch.compile, значно краще, ніж у Claude Opus 4.5/Gemini 3 Pro (близько 40%)
Справжня стеля апаратного забезпечення ШІ — це можливість «програмно розблокувати + оптимізувати замкнений цикл», а не лише сам чіп.
У поєднанні з одночасною подією Apple Ane: Apple M4 ANE: 6,6 TFLOPS/W (у 80 разів більше, ніж у ≈ A100), сотні мільйонів пристроїв залишаються без активності, а вузьким місцем є закритий API + рівень абстракції (CoreML щити у 2–4 рази більшу пропускну здатність)
NVIDIA GPU: RL Agent вивчає «остаточну оптимізацію з реальним апаратним зворотним зв'язком», доводячи, що набуття стратегія може перемогти статичні правила
Обмеження продуктивності апаратного забезпечення (Apple/Nvidia) знищується через штучний інтелект «зворотного інжинірингу + оптимізація RL»: перший розбиває закриті API, щоб перетворити неактивні чипи на обчислювальні потужні ферми, а другий використовує підкріплене навчання, щоб витиснути кожну краплю продуктивності існуючих GPU. У майбутньому застрягне не обчислювальне обладнання, а той, хто першим опановує замкнутий цикл «апаратного зворотного зв'язку + оптимізації незалежного навчання», як м'якого, так і жорсткого, і хто може подвоїти продуктивність існуючого обладнання, може крок за кроком зламати стіну гігантів. Цей складений ріст створює швидкість, яку важко сприймати людською інтуїцією: від 10x до 100x → 1000x за кілька років
Епоха навчання на пристрої (сторона ANE) + екстремальне висновки хмари/периферії (сторона агента CUDA) прискорилася, і сам ШІ може «самооптимізувати» до наближення до теоретичного піку. Потенціал сотень мільйонів неактивних пристроїв Apple + величезних карт NVIDIA колективно відкривається незалежними/корпоративними хакерами та дослідниками.


Найкращі
Рейтинг
Вибране
