ChatGPT AI devient bavard avec des invites vocales

ChatGPT AI devient bavard avec des invites vocales

La société derrière ChatGPT a annoncé lundi qu’elle ajoutait des capacités vocales et d’image à la plate-forme d’intelligence artificielle (IA) générative, longtemps limitée aux invites écrites.

Les fonctionnalités ajoutées aux versions payantes du service permettent aux utilisateurs d’avoir des conversations avec l’IA et même de lui « montrer » de quoi ils parlent, selon OpenAI.

« La voix et l’image vous offrent davantage de façons d’utiliser ChatGPT dans votre vie », a déclaré OpenAI dans un article.

« Prenez une photo d’un point de repère lors d’un voyage et discutez en direct de ce qui est intéressant à ce sujet. »

Des exemples d’utilisation des nouvelles fonctionnalités incluent la prise d’une photo de l’intérieur d’un réfrigérateur pour obtenir des suggestions de recettes de repas ou une photo des devoirs de mathématiques d’un enfant pour obtenir de l’aide pour résoudre des problèmes.

Les capacités vocales et image seront déployées auprès des utilisateurs de ChatGPT Plus et Enterprise au cours des prochaines semaines et seront finalement destinées aux systèmes d’exploitation pour smartphones d’Apple et de Google, selon Open AI.

« Vous pouvez désormais utiliser la voix pour engager une conversation avec votre assistant », a déclaré le créateur de ChatGPT.

« Parlez avec lui lors de vos déplacements, demandez une histoire au coucher pour votre famille ou réglez un débat à table. »

OpenAI a collaboré avec des acteurs vocaux pour rendre les interactions parlées plus réalistes, selon la startup.

Les programmes d’IA générative ont fait irruption sous les projecteurs à la fin de l’année dernière, ChatGPT démontrant sa capacité à générer des essais, des poèmes et des conversations à partir des invites les plus brèves.

Les titans de la technologie Google, Meta et Microsoft font partie de ceux qui s’efforcent de capitaliser sur les promesses de l’IA générative tout en essayant d’éviter des périls tels que le potentiel de cette technologie comme arme de désinformation et de cybercriminalité.

Dans une annonce distincte, la plateforme suédoise de streaming musical Spotify a déclaré lundi qu’elle profitait de la technologie OpenAI pour permettre la traduction des podcasts dans une variété de langues tout en conservant le style original de l’orateur.

« En faisant correspondre la voix du créateur, Voice Translation donne aux auditeurs du monde entier le pouvoir de découvrir et de s’inspirer de nouveaux podcasteurs d’une manière plus authentique que jamais », a déclaré Ziad Sultan, vice-président de la personnalisation de Spotify, dans un communiqué.

Spotify commencera dans les semaines à venir avec des épisodes en anglais traduits en espagnol, français et allemand, selon la société.