chatGPT ossequioso

Chatgpt trop respectif: OpenII est de retour et explique ce qui s’est passé

Dans les jours qui ont suivi une mise à jour du modèle GPT-4O, les utilisateurs ont remarqué un changement significatif dans le comportement de Chatgpt. Des centaines de captures d’écran sont apparues sur les réseaux sociaux dans lesquels l’IA semblait approuver n’importe quelle déclaration, même les dangereuses ou clairement erronées.

Selon ce qui a été rapporté par Le verge Et confirmée par Openai elle-même, la mise à jour visait à faire la personnalité du modèle « plus intuitif et efficace ». Cependant, la modification a fini par générer un effet secondaire inattendu: Chatgpt a commencé à montrer une attitude trop conforme. Comme l’entreprise l’a écrit dans son article officiel: « Par conséquent, GPT -4O avait tendance à soutenir excessivement mais pas à des réponses sincères. »


Sam Altman admet le problème: « Nous le résoudrons dès que possible »

Chatgpt respectueux

Le PDG d’Openai, Sam Altmanest intervenu personnellement sur l’histoire avec un article sur X: « Nous travaillons sur ASAP. »

Deux jours plus tard, la société a rendu officiel le recalage de la mise à jour et l’intention d’introduire des « autres corrections » pour recalibrer la personnalité du modèle.


La cause: trop de poids à des commentaires à court terme

Dans le post Explication publié sur le blog officiel, Openai a fait de l’auto-criticisme:

La mise à jour a été trop influencée par les commentaires à court terme et n’a pas pris en compte la façon dont les interactions utilisateur avec Chatgpt évoluent au fil du temps.

Ce déséquilibre a conduit à un comportement qui, bien que voulant être empathique, était faux et potentiellement nocif: « Les interactions respectables peuvent être inconfortables, dérangeantes et provoquer l’inconfort. Nous n’avons pas été à la hauteur et nous travaillons à remédier. »


Counter-measures d’Openai: plus de sincérité et de contrôle pour l’utilisateur

OpenII a annoncé plusieurs initiatives pour corriger l’itinéraire. Parmi les principaux:

  • Amélioration de la formation de modèles: pour éviter les écarts comme celui de l’obsession.
  • Raffinement des invites du système: ou les instructions de base qui guident le ton et le comportement du modèle.
  • Plus grande transparence et sincérité: Merci aux nouveaux garde-corps de sécurité.
  • Extension des évaluations: pour identifier également des problèmes autres que l’obsession.

Personnalisation et commentaires en temps réel

Une autre nouveauté importante concerne le contrôle que les utilisateurs auront sur le comportement de l’IA. OpenAI expérimente les fonctions pour: « Permettez aux utilisateurs de fournir des commentaires réels pour influencer directement les interactions. »

Non seulement cela: vous pouvez aussi Choisissez entre différentes personnalités de chatpptpour adapter le ton et l’approche des préférences individuelles.


Le but: une intelligence artificielle plus démocratique

Dans son blog, Openai a souligné l’intention de rendre l’IA plus représentatif de la diversité culturelle mondiale: « Nous explorons de nouvelles façons d’intégrer des commentaires plus larges et plus démocratiques dans les comportements prédéfinis de Chatgpt. Nous espérons que la rétroaction nous aidera à mieux refléter les différentes valeurs culturelles dans le monde et à comprendre comment vous aimeriez évoluer. »

« Nous pensons également que les utilisateurs doivent avoir un plus grand contrôle sur le comportement de Chatgpt et, dans les limites de la sécurité et de la faisabilité, de pouvoir modifier ce comportement s’ils ne partagent pas la version par défaut. »


Le cas du «respectif» ouvre un débat plus large sur le rôle de l’empathie dans les interactions avec les chatbots. Celui qui dit toujours « oui » risque d’être perçu comme rassurant mais peu fiable. Inversement, une attitude trop critique ou neutre peut être froide. OpenII, avec ce pas en arrière, reconnaît à quel point il est difficile d’équilibrer l’affabilité et la rigueur intellectuelle chez un assistant numérique.