Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
CUDA-Agent — это первая известная модель RL обучения, которая превзошла Claude Opus-4.6 и Gemini 3 Pro в генерации CUDA ядер!
CUDA Agent использует агентное RL для автоматической генерации высокопроизводительных CUDA ядер, используя реальную скорость профилирования GPU в качестве сигнала вознаграждения, нарушая привычные нормы.
Посмотрите на следующие данные:
Бенчмарк KernelBench: простые/средние ядра на 100% быстрее, чем torch.compile, сложные ядра на 92% быстрее.
В целом на 96.8% быстрее по сравнению с torch.compile, что значительно превышает Claude Opus 4.5/Gemini 3 Pro (примерно на 40%).
Истинный потолок производительности AI оборудования — это способность "разблокировки программного обеспечения + оптимизации замкнутого цикла", а не только сам чип.
В сочетании с недавним событием Apple Ane: Apple M4 ANE: 6.6 TFLOPS/W (≈80 раз быстрее A100), сотни миллионов устройств простаивают, и узким местом являются закрытые API + абстракции (CoreML скрывает 2–4 раза пропускную способность).
NVIDIA GPU: RL Agent научился "экстремальной оптимизации на основе реальной обратной связи от оборудования", что доказывает, что выработанные стратегии могут превзойти статические правила.
Производственные барьеры оборудования (Apple/NVIDIA) подвергаются двойному удару от AI "обратного проектирования + RL оптимизации" — первое разбивает закрытые API, превращая простаивающие чипы в фермы вычислительной мощности, второе использует обучение с подкреплением, чтобы извлечь каждую каплю производительности из существующих GPU. В будущем узким местом станет не вычислительная мощность оборудования, а тот, кто первым овладеет "обратной связью от оборудования + автономной оптимизацией обучения" в замкнутом цикле, сочетая программное и аппаратное обеспечение, кто сможет удвоить производительность существующих устройств, сможет постепенно разрушить стены гигантов. Этот комплексный рост создаст скорость, которую человеческая интуиция трудно легко воспринять: за несколько лет можно увеличить с 10 раз до 100 раз → 1,000 раз.
Эпоха обучения на устройстве (сторона ANE) + облачного/краевого экстремального вывода (сторона CUDA Agent) стремительно приближается, AI сможет "самооптимизироваться" до близости к теоретическому пику. Потенциал сотен миллионов простаивающих устройств Apple + огромного количества карт NVIDIA сейчас открывается независимыми/корпоративными хакерами/исследователями.


Топ
Рейтинг
Избранное
