Alors qu’OpenAI avait annoncé que la fonction Advanced Voice de GPT-4o ne serait disponible que dans quelques mois, certains utilisateurs ont pourtant pu y accéder plus tôt que prévu. Cela leur a permis d’explorer concrètement cette nouvelle version de l’assistant vocal.
En mai dernier, OpenAI a dévoilé le mode Advanced Voice, une fonctionnalité de ChatGPT permettant une interaction vocale fluide avec le chatbot, similaire à un assistant vocal. Cette annonce incluait également GPT-4o, un modèle de langage multimodal plus puissant que GPT-4. Bien qu’OpenAI ait précisé que cette fonction ne serait pas disponible immédiatement, certains utilisateurs y ont eu accès de manière imprévue, comme le rapporte Tom’s Guide.
Parmi ces utilisateurs, RozziTheCreator a partagé sur Reddit un enregistrement d’une conversation avec ChatGPT utilisant une voix inédite. Dans cet enregistrement, la voix raconte une histoire d’horreur, agrémentée d’effets sonores inquiétants. RozziTheCreator a indiqué qu’il n’a eu accès à cette fonction que pendant quelques minutes, avec plusieurs problèmes techniques rencontrés.
Interrogée par Tom’s Guide, OpenAI a confirmé qu’il s’agissait d’une erreur rapidement corrigée, permettant à certains utilisateurs d’accéder à la version vocale de GPT-4o. Cette fuite a permis de découvrir pour la première fois le mode Advanced Voice non supervisé par OpenAI. Jusqu’à présent, seules des démonstrations contrôlées avaient été présentées. La vidéo de RozziTheCreator montre une IA capable de parler de manière naturelle et d’ajouter des effets sonores, une nouveauté pour ChatGPT.
OpenAI a publié sur X une mise à jour concernant l’avancement du mode vocal de ChatGPT sous GPT-4o. L’entreprise a rappelé qu’elle prévoyait de déployer une première version de cette fonction à certains utilisateurs de ChatGPT Plus. Cependant, tout n’est pas encore prêt : « Nous améliorons la capacité du modèle à détecter et refuser certains contenus. Nous travaillons également à l’amélioration de l’expérience utilisateur et à la préparation de notre infrastructure ». Ainsi, le lancement est reporté d’un mois.
En raison de ce retard, tous les utilisateurs de ChatGPT Plus pourront accéder au mode Advanced Voice à l’automne. Les délais exacts dépendront du respect des normes élevées de sécurité et de fiabilité d’OpenAI.