Et demain ?
OpenAI ne compte pas s’arrêter là. L’entreprise travaille déjà sur de nouvelles améliorations, notamment la possibilité pour les développeurs d’utiliser leurs propres voix personnalisées. La vidéo figure aussi parmi les prochaines frontières. L’objectif: créer des expériences “agentiques multimodales” capables d’intégrer texte, audio et vidéo.
Ces avancées soulèvent des questions sur la manière dont nous interagirons avec l’IA dans les années à venir. Les interfaces textuelles qui dominent aujourd’hui pourraient bien céder la place à des conversations naturelles, où l’IA nous comprend et nous répond avec les nuances vocales appropriées.
OpenAI semble avoir pris une longueur d’avance dans cette course à l’interaction naturelle. Ces modèles audio, disponibles dès maintenant via l’API de l’entreprise, pourraient bien transformer notre relation quotidienne avec la technologie. Vous imaginez discuter avec votre assistant comme avec un ami, qui adapte son ton selon vos besoins du moment ? Cette réalité n’a jamais été aussi proche.