que nous finissons par parler à une AI

La plupart du temps, le clavier est notre façon d’utiliser Chatgpt. Il en va de même pour les Gémeaux, Claude, Llama ou tout autre modèle de marché. Et pourtant, l’interaction directe avec notre voix gagne entière. Parler avec les machines peu à petit est moins étrange. Et moins que ce sera.

Appel 4. Dans les temps financiers, ils citent des sources proches du projet de développement du nouveau méta-modèle. Appelez 4 – Si cela finit par s’appeler – il se concentrera sur l’amélioration des caractéristiques d’interaction vocale. Il y aura également des options destinées à cet avenir des agents de l’IA, sans aucun doute, mais la voix semble être un protagoniste spécial. Ce nouveau modèle devrait arriver «dans les semaines à venir».

Voix indigène. Chris Cox, l’un des managers maximum de Meta, a indiqué qu’il appelle 4 un « omnimodelo » dans lequel « la voix sera originaire ». Jusqu’à présent, a-t-il expliqué, le processus était lourd. Vous avez dû convertir la voix en texte, envoyer le texte au LLM, obtenir la réponse en texte et le retourner en voix.

C’est une révolution, disent-ils dans le but. Cette conception native de la voix est une option particulièrement importante pour l’interaction avec les chatbots mais aussi avec le matériel. Et ici, la cible RA-Ban peut être les grands bénéficiaires. Comme l’a dit Cox, il est important « pour l’interface du produit, l’idée que vous pouvez parler à Internet et demander quoi que ce soit. Je pense que nous n’avons pas encore fait à l’idée de sa puissance. »

Tout pour le même. Mais c’est que l’objectif est loin d’être le seul à penser cela. Google propose depuis longtemps des fonctions vocales dans les Gémeaux dans nos téléphones mobiles, et a un avantage car nous avions déjà l’habitude d’utiliser Google Assistant. Openai nous a étonnés il y a des mois avec GPT-4O et cette voix qui est même devenue enseignante de toute discipline.

Elon Musk et sa startup, Xai, ont élevé un Grok 3 des plus parlanchies et qui peuvent adopter des tons personnalisés comme un « dérangé » et un autre « sexy » pour nous parler. Claude semble plus à la traîne ici, mais même Alexa +, le nouveau modèle Amazon, a un composant conversationnel très fort avec l’IA, quelque chose de logique provenant d’où il vient.

Voix presque humaines. Et tandis que les assistants vocaux d’il y a quelques années offraient des voix adéquates mais quelque peu plates, les modèles d’IA actuels réalisent des voix pratiquement indiscernables de l’homme. Hier, nous avons parlé de sésame et de cette voix synthétisée qui s’arrête et change la tonalité pour s’adapter à la conversation comme le ferait un humain. Dans cette même carrière, d’autres comme onze laboratoires ou

Quoi taper. Bien que le clavier ait toujours eu l’avantage de nous permettre de « réfléchir avant de parler », l’interaction directe avec les modèles d’IA semble beaucoup plus puissante dans de nombreux scénarios dans lesquels cette conversation en temps réel est une option gagnante.

Je vous prépare à parler aux machines. Tous ces efforts sont dirigés vers le même endroit: parler à une IA. Celui qui est probablement en ce moment dans le cloud, mais qui peut fonctionner immédiatement sur notre mobile, mais aussi dans des lunettes connectées telles que l’avenir de la ligne d’arrivée – un casque ou une montre intelligente. Et comme c’était le cas avec «elle», nous pouvons voir beaucoup de gens qui portent des lunettes ou un casque et semblent parler seuls. Mais cela parle en fait avec une IA.

Image | Photos de Warner Bros

Dans Simseo | Sommes-nous prêts à parler aux machines?