Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

0xFunky
Start-up de IA Biomédica - CTO / Concurso Kaggle - Máster / @GooseCityDAO / Fundador @codechainAI
Por eso construyo VibeHQ.
Construyo una organización real de IA, no envolviendo APIs ni confiando en ventanas de contexto compartido y desordenadas, sino orquestando agentes nativos de CLI (Claude Code, Codex, Gemini CLI) en un equipo profesional estructurado.
En esta demostración, 7 agentes autónomos, PM en Codex, Designer + Engineers + QA en Claude Code, construyeron un sistema hospitalario full-stack a partir de una sola instrucción al PM, en solo 15 minutos.
Para mí, esto es un verdadero trabajo en colaboración entre varios agentes: roles claros, propiedad definida, límites estrictos y traspasos estructurados, igual que en una empresa real.
Se pueden ver claramente las dinámicas: los responsables de diseño al principio y luego retroceden, Ingeniería impulsa la ejecución, QA espera a que las características se estabilicen antes de intervenir, y el PM monitoriza y coordina continuamente, esto no es un caos de memoria compartida, es una ejecución estructurada, igual que una empresa profesional de software.
@karpathy clavado en la visión
"Ahora estás programando una organización... El código fuente es la colección de prompts, habilidades, herramientas y procesos."
VibeHQ es de código abierto (enlace en las respuestas). Siempre se agradecen opiniones, ideas y debates técnicos.
Siguiente paso: una empresa de IA visualizada construida sobre esta arquitectura organizativa, donde literalmente puedes ver a tus agentes trabajando, coordinando y enviando juntos.

Andrej Karpathy28 feb 2026
Tuve la misma idea, así que he estado probándolo en nanochat. Por ejemplo, aquí hay 8 agentes (4 claude, 4 códex), con 1 GPU cada uno ejecutando experimentos nanochat (intentando eliminar el softcap de logit sin regresión). El resumen es que no funciona y es un desastre... Pero sigue siendo muy bonito de ver :)
Probé varias configuraciones: 8 investigadores independientes en solitario, 1 científico jefe dando trabajo a 8 investigadores junior, etc. Cada programa de investigación es una rama git, cada científico lo bifurca en una rama de funcionalidad, árboles de trabajo git para aislamiento, archivos simples para comunicaciones, salta Docker/VMs por simplicidad ahora mismo (encuentro que las instrucciones son suficientes para evitar interferencias). La organización de investigación funciona en cuadrículas de ventanas tmux de sesiones interactivas (como Teams) para que sea bonito de ver, ver su trabajo individual y "tomar el control" si es necesario, es decir, sin -p.
Pero vale, la razón por la que no funciona hasta ahora es que las ideas de los agentes son bastante malas desde el principio, incluso con la inteligencia más alta. No piensan cuidadosamente en el diseño de los experimentos, ejecutan variaciones un poco absurdas, no crean líneas base fuertes ni ablacionan las cosas correctamente, no controlan cuidadosamente el tiempo de ejecución o los flops. (Por ejemplo, ayer un agente "descubrió" que aumentar el tamaño oculto de la red mejora la pérdida de validación, lo cual es un resultado totalmente innecesario dado que una red más grande tendrá una pérdida de validación menor en el régimen de datos infinitos, pero además entrena mucho más tiempo, no está claro por qué tuve que intervenir para señalarlo). Son muy buenos implementando cualquier idea bien definida y descrita, pero no la generan creativamente.
Pero el objetivo es que ahora estés programando una organización (por ejemplo, una "organización de investigación") y sus agentes individuales, así que el "código fuente" es la colección de prompts, habilidades, herramientas, etc. y procesos que lo componen. Por ejemplo, una reunión diaria de pie por la mañana ahora forma parte del "código de organización". Y optimizar el preentrenamiento de nanochat es solo una de las muchas tareas (casi como una evaluación). Entonces, dada una tarea arbitraria, ¿qué tan rápido genera progresos en ella tu organización de investigación?
370
Incluso Andrej K no pudo evitar empezar a usar OpenClaw...
El Mac mini vuelve a ser lanzado, y parece que va a ser más difícil de comprar otra vez.
Entre ellas, AK también mencionó varias versiones más pequeñas de Claw, y descubrió que ZeroClaw tiene un token y Dev también apoya a la comunidad, y el número de Estrellas es mayor que el de NanoClaw, ahora solo son 100K, y NanoClaw puede llegar a 500K sin reclamar, comprar un poco de apoyo...
Siempre DYOR。
448
Empecé a sentirme un poco ansioso tras solo unos días en el extranjero, no por el intercambio ni por el perro dorado.
Pero como no he publicado en unos días, veo que la tecnología de IA está iterando demasiado rápido, y cada vez salen más aplicaciones y modelos nuevos, y temo no poder seguir aprendiendo lo último tras solo unos días de lectura...
Gracias de nuevo a Crypto, puedo cumplir uno de nuestros deseos de vida con mi esposa, la vida es impermanente y tratar bien a las personas importantes que me rodean.
¡Os deseo un feliz Año Nuevo por adelantado y enriquecedos en el Año del Caballo! Tengo mucha suerte de haber encontrado varias explosiones de auroras en el Círculo Polar Ártico esta vez, y espero que todos podamos 🙏 desear buena suerte
Después de volver a Taiwán tras este viaje, ¡correré con todas mis fuerzas!


514
Populares
Ranking
Favoritas
