Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Bina @EurekaLabsAI. Daha önce AI Direktörü @ Tesla, kurucu ekip @ OpenAI, CS231n/PhD @ Stanford. Büyük derin sinir ağlarını eğitmeyi severim.
Ben de aynı düşünceyi düşündüm, bu yüzden nanochat'te oynuyorum. Örneğin, işte 8 ajan var (4 Claude, 4 codex), her biri 1 GPU nanochat deneyleri yapıyor (logit softcap'ını regresyon olmadan silmeye çalışıyor). Özetle, çalışmıyor ve tam bir karmaşa... Ama yine de bakması çok güzel:)
Birkaç düzen denedim: 8 bağımsız solo araştırmacı, 1 baş bilim insanı 8 genç araştırmacıya iş veriyor, vb. Her araştırma programı bir git dalıdır, her bilim insanı onu bir özellik dalına çatallar, izolasyon için git iş ağaçları, iletişim için basit dosyalar, şu anda basitlik için Docker/VM'leri atlar (komutların paraziti önlemek için yeterli olduğunu düşünüyorum). Araştırma organizasyonu, etkileşimli oturumların tmux pencere ızgaralarında (Teams gibi) çalışıyor, böylece bakmak, bireysel çalışmalarını görmek ve gerekirse "devralmak" için güzel oluyor, yani -p yok.
Ama şimdiye kadar çalışmamasının sebebi, ajanların fikirlerinin kutudan çıktığı gibi oldukça kötü olması, en yüksek zekada bile. Deney tasarımında dikkatli düşünmezler, biraz mantıksız varyasyonlar yaparlar, güçlü bazlar oluşturmuyor ve işleri düzgün ablate etmiyorlar, çalışma süresi veya floplar için dikkatli kontrol etmiyorlar. (Örneğin, dün bir ajan "keşfetti" ki ağın gizli boyutunu artırmak doğrulama kaybını artırıyor, ki bu tamamen sahte bir sonuç çünkü daha büyük bir ağın sonsuz veri rejiminde doğrulama kaybı daha düşük olur, ama aynı zamanda çok daha uzun süre eğitim alır, neden gelip bunu belirtmek zorunda kaldığım belli değil). İyi kapsamlı ve tanımlanmış herhangi bir fikri uygulamada çok iyidirler ama yaratıcı olarak üretemezler.
Ama amaç artık bir organizasyonu (örneğin "araştırma organizasyonu") ve bireysel ajanlarını programlamaktır; yani "kaynak kodu" onu oluşturan promptlar, beceriler, araçlar vb. ve süreçlerin bir koleksiyonudur. Örneğin, sabah her gün yapılan stand-up artık "organizasyon kodu"nun bir parçası. Ve nanochat ön eğitimini optimize etmek, birçok görevden sadece biri (neredeyse bir değerlendirme gibi). O zaman - rastgele bir görev verildiğinde, araştırma organizasyonunuz bu konuda ne kadar hızlı ilerleme sağlıyor?

Thomas Wolf28 Şub 2026
NanoGPT hız koşu meydan okuması neden artık tamamen yapay zeka otomatik araştırma değil?
669
Token talebinin yaklaşan tsunamisiyle, LLM'ler için temel bellek+hesaplama *tam doğru* düzenleme fırsatları var.
Temel ve bariz olmayan kısıtlama, çip üretim süreci nedeniyle iki tamamen farklı bellek havuzu elde etmesidir (farklı fiziksel uygulamalara da): 1) hesaplama birimlerinin hemen yanında olan ve inanılmaz hızlı ama çok düşük kapasiteye sahip çip içi SRAM ve 2) çok yüksek kapasiteye sahip çip dışı DRAM, ama içeriğini uzun bir pipetten emebilirsiniz. Bunun üstüne, mimarinin birçok detayı (örneğin sistolik diziler), sayısal sistemler vb. vardır.
Optimal fiziksel substratın tasarımı ve ardından LLM'lerin en üst hacimli iş akışlarında (çıkarım ön doldurma/çözme, eğitim/ince ayarlama vb.) en iyi veri aktarımı/gecikme/$ ile bellek+hesaplamanın orkestrasyonu, muhtemelen günümüzün en ilginç entelektüel bulmacasıdır ve en yüksek ödülleri verir (\ 4.6T NVDA). Hepsi hızlı ve ucuz çok sayıda token elde etmek için. Tartışmasız, en önemli iş akışı (çıkarım çözme *ve* uzun token bağlamlarında sıkı ajanik döngülerde) bugün var olanların ~her iki kampı (HBM-önce NVIDIA komşu ve SRAM öncesi Cerebras) tarafından aynı anda elde edilmesi en zor olanıdır. Her neyse, MatX ekibi A++ derecesinde, bu yüzden küçük bir katılım olduğu için benim için bir zevk ve zam için tebrikler!

Reiner Pope25 Şub 2026
Diğer çiplerden çok daha yüksek veri verimliliği sağlayan ve aynı zamanda en düşük gecikmeyi sağlayan bir LLM çipi inşa ediyoruz. Biz buna MatX Olanı diyoruz.
MatX One çipi, büyük sistolik dizilerin ünlü olduğu enerji ve alan verimliliğine sahip, ayrıca esnek şekillere sahip küçük matrislerde yüksek kullanım sağlayan bölünebilir sistolik diziye dayanır. Çip, SRAM öncelikli tasarımların düşük gecikmesini HBM'nin uzun bağlam desteğiyle birleştirir. Bu unsurlar ve sayısal sistemlere yeni bir bakış açısı, LLM'lerde duyurulan herhangi bir sistemden daha yüksek veri sağlıyor ve aynı zamanda SRAM öncelikli tasarımların gecikmesini de eşliyor. Daha yüksek veri verimliliği ve daha düşük gecikme, abonelik bütçenize göre daha akıllı ve daha hızlı modeller sunar.
Geliştirmeyi tamamlamak ve üretimi hızlıca ölçeklendirmek için 500 milyon dolarlık bir Seri B topladık; bir yıldan kısa sürede taipleme işlemi yapılacak. Tur, teknolojiye en bilgili Wall Street firmalarından biri olan Jane Street ve kurucusu @leopoldasch AGI hakkında kesin notu yazan Situational Awareness LP tarafından yönetildi. Katılımcılar arasında @sparkcapital, @danielgross ve @natfriedman's fonu, @patrickc ve @collision, @TriatomicCap, @HarpoonVentures, @karpathy, @dwarkesh_sp ve diğerleri bulunmaktadır. Ayrıca tedarik zinciri genelinden, Marvell ve Alchip dahil yatırımcıları da memnuniyetle karşılıyoruz.
@MikeGunter_ ve ben MatX'i kurduk çünkü LLM'ler için en iyi çipin, LLM'lerin neye ihtiyacı olduğunu ve nasıl gelişeceğini derinlemesine anlayarak ilk prensiplerden tasarlanması gerektiğini düşündük. Böyle bir çip için küçük model performansından, düşük hacimli iş yüklerinden ve hatta programlama kolaylığından vazgeçmeye hazırız.
Artık öğrenme hızı programlarından Swing Modulo Planlamaya, guard/round/sticky bit'lere, kör eşleşmiş bağlantılara kadar her şeyi düşünen 100 kişilik bir ekip olduk—hepsi aynı binada. Eğer büyük hacimde birçok nesil çip tasarlamamızda ve dağıtmamızda bize yardımcı olmak isterseniz, bize katılmayı düşünebilirsiniz.
212
CLI'lar tam da "miras" bir teknoloji olmaları nedeniyle çok heyecan verici; yani yapay zeka ajanları onları doğal ve kolay kullanabiliyor, birleştirebiliyor ve tüm terminal araç seti üzerinden etkileşime girebiliyor.
Örneğin, Claude/Codex ajanınızdan bu yeni Polymarket CLI'yı kurmasını isteyin ve herhangi bir keyif paneli, arayüz veya mantık isteyin. Temsilciler bunu sizin için inşa edecek. Github CLI'yı da yükleyin, onlardan depoda gezinmelerini, sorunları, PR'leri, tartışmaları, hatta kodun kendisini görmelerini isteebilirsiniz.
Örnek: Claude, bu terminal gösterge panelini ~3 dakikada, en yüksek hacimli polimarketlerin ve 24 saatlik değişimin bir kısmında inşa etti. Ya da bunu bir web uygulaması ya da istediğiniz herhangi bir şey yapabilirsiniz. Daha büyük boru hatlarının bir modülü olarak kullandığınızda daha da güçlü.
Herhangi bir ürün veya hizmetiniz varsa, şunu düşünün: Ajanlar onlara erişebilir ve kullanabilir mi?
- İnsanlar için olan eski belgeleriniz en azından Markdown'da ihraç edilebilir mi?
- Ürününüz için Beceriler yazdınız mı?
- ürününüz/hizmetiniz (CLI) üzerinden kullanılabilir mi? Yoksa MCP mi?
- ...
2026. Yap. Için. Ajanlar.


Suhail Kakar24 Şub 2026
Çoklu Pazar CLI'nin Tanıtımı - Yapay Zeka Ajanlarının Tahmin Piyasalarına En Hızlı Erişim Yolu
Pasla yapılmış. Temsilciniz piyasaları sorgulayabilir, işlem yapabilir ve veri çekebilir - hepsi terminalden
hızlı, hafif, yük yok
156
En İyiler
Sıralama
Takip Listesi
