ChatGPT est désormais meilleur que jamais pour simuler les émotions et les comportements humains

ChatGPT est désormais meilleur que jamais pour simuler les émotions et les comportements humains

Plus tôt cette semaine, OpenAI a lancé GPT-4o (« o » pour « omni »), une nouvelle version du système d'intelligence artificielle (IA) qui alimente le populaire chatbot ChatGPT. GPT-4o est présenté comme une étape vers un engagement plus naturel avec l’IA. Selon la vidéo de démonstration, il peut avoir des conversations vocales avec les utilisateurs en temps quasi réel, présentant une personnalité et un comportement semblables à ceux des humains.

Cet accent mis sur la personnalité est susceptible d’être un point de discorde. Dans les démos d'OpenAI, GPT-4o semble convivial, empathique et engageant. Il raconte des blagues « spontanées », rit, flirte et chante même. Le système d’IA montre également qu’il peut réagir au langage corporel et au ton émotionnel des utilisateurs.

Lancée avec une interface simplifiée, la nouvelle version d'OpenAI du chatbot ChatGPT semble conçue pour accroître l'engagement des utilisateurs et faciliter la création de nouvelles applications basées sur ses capacités de texte, d'image et d'audio.

GPT-4o constitue un autre pas en avant pour le développement de l’IA. Cependant, l’accent mis sur l’engagement et la personnalité soulève d’importantes questions quant à savoir si cela servira réellement les intérêts des utilisateurs, ainsi que les implications éthiques de la création d’une IA capable de simuler les émotions et les comportements humains.

Le facteur personnalité

OpenAI considère GPT-4o comme une IA conversationnelle plus agréable et engageante. En principe, cela pourrait rendre les interactions plus efficaces et augmenter la satisfaction des utilisateurs.

Des études montrent que les utilisateurs sont plus susceptibles de faire confiance et de coopérer avec les chatbots présentant une intelligence sociale et des traits de personnalité. Cela pourrait s’avérer pertinent dans des domaines tels que l’éducation, où des études ont montré que les chatbots IA peuvent améliorer les résultats d’apprentissage et la motivation.

Cependant, certains commentateurs craignent que les utilisateurs ne deviennent trop attachés aux systèmes d’IA dotés de personnalités humaines ou soient émotionnellement blessés par la nature à sens unique de l’interaction homme-machine.

L'effet Elle

GPT-4o a immédiatement inspiré des comparaisons, notamment de la part du patron d'OpenAI, Sam Altman, avec le film de science-fiction Her de 2013, qui dresse un tableau saisissant des pièges potentiels de l'interaction homme-IA.

Dans le film, le protagoniste, Theodore, devient profondément fasciné et attaché à Samantha, un système d'IA à la personnalité sophistiquée et pleine d'esprit. Leur lien brouille les frontières entre le réel et le virtuel, soulevant des questions sur la nature de l’amour et de l’intimité, ainsi que sur la valeur de la connexion homme-IA.

Même si nous ne devrions pas comparer sérieusement GPT-4o à Samantha, cela soulève des préoccupations similaires. Les compagnons IA sont déjà là. À mesure que l’IA devient de plus en plus apte à imiter les émotions et les comportements humains, le risque que les utilisateurs développent de profonds attachements émotionnels augmente. Cela pourrait conduire à une confiance excessive, à des manipulations, voire à des préjudices.

Bien qu’OpenAI se soucie de garantir que ses outils d’IA se comportent en toute sécurité et soient déployés de manière responsable, nous n’avons pas encore appris les implications plus larges du déploiement d’IA charismatiques dans le monde. Les systèmes d’IA actuels ne sont pas explicitement conçus pour répondre aux besoins psychologiques humains – un objectif difficile à définir et à mesurer.

Les capacités impressionnantes de GPT-4o montrent à quel point il est important que nous disposions d'un système ou d'un cadre pour garantir que les outils d'IA sont développés et utilisés d'une manière alignée sur les valeurs et les priorités du public.

Capacités étendues

GPT-4o peut également fonctionner avec la vidéo (de l'utilisateur et de son environnement, via la caméra d'un appareil ou des vidéos préenregistrées) et répondre de manière conversationnelle. Dans les démonstrations d'OpenAI, GPT-4o commente l'environnement et les vêtements d'un utilisateur, reconnaît les objets, les animaux et le texte et réagit aux expressions faciales.

L'assistant Project Astra AI de Google, dévoilé un jour seulement après GPT-4o, affiche des capacités similaires. Il semble également avoir une mémoire visuelle : dans l'une des vidéos promotionnelles de Google, il aide un utilisateur à retrouver ses lunettes dans un bureau très fréquenté, même si elles ne sont pas visibles pour l'instant par l'IA.

GPT-4o et Astra poursuivent la tendance vers des modèles plus « multimodaux » capables de fonctionner avec du texte, des images, de l'audio et de la vidéo. Le prédécesseur de GPT-4o, GPT-4 Turbo, peut traiter du texte et des images ensemble, mais pas l'audio et la vidéo. La version originale de ChatGPT, publiée il y a moins de deux ans, était basée uniquement sur du texte.

GPT-4o est également nettement plus rapide que son prédécesseur.

La capacité de travailler sur l’audio, l’image et le texte en temps réel est considérée comme cruciale pour développer des systèmes d’IA avancés capables de comprendre le monde et d’atteindre efficacement des objectifs complexes et significatifs.

Mais certains critiques affirment que les capacités de texte de GPT-4o ne sont que progressivement meilleures que celles de GPT-4 Turbo et de concurrents tels que Gemini Ultra de Google et Claude 3 Opus d'Anthropic.

Les grands laboratoires d’IA seront-ils capables de maintenir le rythme rapide des améliorations récentes en continuant à construire des modèles plus grands et plus sophistiqués ? Il s’agit d’un sujet brûlant de débat parmi les experts, et le résultat déterminera l’impact de la technologie au cours des années à venir.

Accès plus large

Un aspect moins voyant mais significatif du lancement de GPT-4o est que, contrairement à ses précurseurs de la famille GPT-4, le nouveau système d'IA est disponible pour tous les utilisateurs dans la version gratuite de ChatGPT, sous réserve de limites d'utilisation.

Cela signifie que des millions d'utilisateurs dans le monde viennent de bénéficier d'une mise à niveau de GPT-3.5 vers un système d'IA plus puissant avec plus de fonctionnalités. GPT-4o est nettement plus utile que GPT-3.5 à diverses fins, telles que le travail et l'éducation. L’impact de cette évolution deviendra plus apparent au fil du temps.

Et après?

La présentation par OpenAI de GPT-4o a déçu les passionnés de systèmes d'IA toujours plus puissants, qui espéraient que l'arrivée de GPT-5 était imminente plus d'un an après le lancement de GPT-4.

Au lieu de cela, le dévoilement cette semaine de GPT-4o et les dernières annonces de Google en matière d'IA mettent l'accent sur les fonctionnalités intégrées à leurs produits. Ces nouveaux développements laissent entrevoir des possibilités telles que des assistants virtuels plus sophistiqués, capables d'effectuer des tâches complexes pour le compte des utilisateurs, impliquant une interaction et une planification plus riches.

Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lisez l'article original.La conversation