Previzualizarea S2S a OpenAI este finisată, dar încă gândește în trepte. Modelul → → → text → vorbire. Așa nu comunică oamenii. Vă prezint Hydra. Un model nativ speech-to-speech care nu așteaptă să se schimbe, nu aplatizează emoțiile în text și nu se strică când le întrerupi în mijlocul propoziției. Hydra raționează asincron, vorbește și ascultă simultan și păstrează emoția pentru că aceasta nu părăsește niciodată domeniul audio. Este încă în beta, dar schimbarea este evidentă. Dacă vrei acces anticipat, linkul este în comentarii. Iată o previzualizare a modului în care arată -