le nouveau mode vocal
OpenAI nous a surpris en mai de cette année avec l'annonce d'un mode vocal dans le plus pur style « Elle » pour ChatGPT. La société dirigée par Sam Altman avait alors promis que la nouvelle arriverait dans « les semaines à venir », mais a annoncé un mois plus tard qu’elle avait besoin d’un peu plus de temps pour résoudre certains problèmes de sécurité.
Les jours ont passé et le nouveau mode vocal tant attendu est là. Nous sommes confrontés à une sortie massive d’une version finale, mais plutôt à un déploiement assez contenu d’une version alpha pour les utilisateurs de ChatGPT Plus. Ils dureront jusqu'en août, mois au cours duquel tous les utilisateurs du plan de paiement susmentionné devraient avoir accès à la fonction.
En attente de capacités de vision
Si vous faites partie des utilisateurs choisis pour essayer le nouveau mode vocal, vous recevrez un message dans l'application. Une fois activé, vous pourrez interagir avec ChatGPT propulsé par GPT-4o beaucoup plus naturellement. Rappelons que l'une des améliorations par rapport au mode vocal original est qu'il est possible de vous interrompre et que vous pouvez également avoir des conversations émotionnelles.
Sur un plan légèrement plus technique, le mode vocal original fonctionnait de manière très différente. Vous avez converti la parole en texte, GPT-4 a traité ce texte et la réponse a été reconvertie en parole. GPT-4o est un modèle multimodal, donc tout est traité directement. La conséquence? Comme nous l’avons vu, la latence est extrêmement faible.
La bonne nouvelle est que vous ne serez pas limité uniquement à la langue anglaise. OpenAI affirme avoir testé le mode vocal avec plus de 45 langues. Il y a cependant certains changements par rapport à ce que nous avons vu le jour de la présentation. Malgré sa capacité à jouer d'autres voix, du moins pour l'instant, seules quatre voix sont disponibles (Juniper, Breeze, Cove et Ember).
Sky, la voix qui ressemblait à celle de Scarlett Johansson, Il ne sera pas disponible. L'actrice qui jouait Samantha dans le film « Her » avait été « choquée, en colère et incrédule » après avoir entendu une voix si similaire à la sienne sur ChatGPT. Johansson avait rejeté une offre d'Altman pour fournir sa voix dans le célèbre chatbot d'intelligence artificielle.
Dans la démo d'il y a quelques mois, nous avons vu ChatGPT aider certains enfants à faire leurs devoirs ou décrire ce qu'il y avait dans une pièce pendant que les employés d'OpenAI conversaient couramment. Ces fonctionnalités sont alimentées par les capacités de vision de GPT-4o, mais la société affirme qu'elles « arriveront à une date ultérieure ».
Images | OpenAI
À Simseo | Les créateurs d'Instagram pourront discuter avec tous leurs abonnés. Mais ils ne le feront pas, mais leurs robots