La preview S2S di OpenAI è raffinata, ma continua a pensare in passaggi.
Voce → testo → modello → testo → voce.
Non è così che gli esseri umani conversano.
Presentiamo Hydra.
Un modello nativo di voce-in-voce che non aspetta il turno, non appiattisce l'emozione in testo e non si interrompe quando lo interrompi a metà frase.
Hydra ragiona in modo asincrono, parla e ascolta simultaneamente e preserva l'emozione perché non esce mai dal dominio audio.
È ancora in beta, ma il cambiamento è ovvio. Se vuoi accesso anticipato, il link è nei commenti.
Ecco un'anteprima di come appare -
Sono entusiasta di lanciare @useclick_ai - un cursore per il tuo assistente AI. Il mio obiettivo è permettere agli assistenti AI di fare più che semplicemente chattare. Contattami per vedere una demo sulla tua piattaforma!