Présente GPT-4.1 avec deux autres modèles de langue pour continuer à marquer le rythme AI

La semaine commence par le mouvement dans le monde de l’intelligence artificielle (IA). OpenAI a présenté une nouvelle famille de modèles de langue: GPT-4.1, GPT-4.1 Mini et GPT-4.1 Nano. Trois versions conçues pour répondre à différents besoins, des charges de travail intensives aux tâches plus simples, et spécialement conçues pour les intégrer dans les applications.

Nous parlons de trois alternatives qui, du moins pour l’instant, ne seront disponibles que via l’API OpenAI. Cela implique que son utilisation sera limitée à l’étendue du développement. En d’autres termes, ils ne seront pas disponibles dans Chatgpt pour une utilisation générale.

Il en va de même pour les nouveaux modèles OpenAI

L’arrivée de ces nouveaux modèles soulève une question inévitable: où sont les autres propositions d’Openai devant les autres propositions? La société dit qu’elle dépasse GPT-4O et GPT-4O Mini, présentée l’année dernière « Dans presque toutes les dimensions»En fait, il affirme qu’ils s’améliorent même sous certains aspects de GPT-4.5, lancés plus tôt cette année.

Parmi ses forces, une fenêtre de contexte jusqu’à un million de jetons se démarque. Simple: c’est la quantité de texte que le modèle ne peut prendre en compte que d’une seule fois pour générer une réponse. De plus, OpenAI a mis à jour la base de connaissances du modèle jusqu’en juin 2024, ce qui signifie qu’il fonctionne avec des informations plus récentes.

L’entreprise dirigée par Sam Altman s’assure que cette nouvelle famille de modèles a été conçue pour être utile dans de vrais scénariosavec une approche claire des résultats qu’ils peuvent offrir et de leurs performances. C’est un détail intéressant, car ils ne se limitent pas à se vanter des repères, un cadre de référence n’indique pas nécessairement à quel point les modèles sont bons.

Dans tous les cas, GPT-4.1 se démarque dans les références dans trois domaines:

GPT 4 1 Points de référence

Programmation. GPT-4.1 obtient un score de 54,6% dans SWE-Bench vérifié, s’améliorant à 21,4 points pour GPT-4O et en 26,6 points à GPT-4.5.
Capacité à suivre les instructions. Dans l’échelle de référence Multichallenge en échelle, un test qui évalue la façon dont un modèle suit les instructions, GPT-4.1 atteint 38,3%, avec une amélioration de 10,5 points par rapport à GPT-4O.
Contexte long. Dans Video MME, un test axé sur la compréhension des contextes longs et multimodaux, GPT-4.1 marque un nouveau maximum: 72,0% dans la catégorie «Long Without Sous-titres», dépassant le GPT-4O en 6,7 points.

En général, plus les modèles sont plus grands et puissants, plus ils ont besoin de ressources pour fonctionner et, par conséquent, plus ils sont chers. Mais le prix n’est pas le seul facteur à considérer: Ils sont également généralement lents. C’est là que les modèles «mini» entrent en jeu, conçus pour l’analyse de texte rapide ou les chatbots de service client.

GPT-4.1 a un coût de 2 dollars par million de jetons d’entrée et 8 dollars par million de jetons générés. GPT-4.1 Mini réduit ce chiffre à 0,40 dollars par million de jetons d’entrée et 1,60 par million. Pour sa part, GPT-4.1 Nano est l’option la plus économique: 0,10 $ par million de jetons d’entrée et 0,40 par million de départ.

GPT-4.1, GPT-4O et GPT-4O MINI Ils sont déjà disponibles pour l’intégration via l’API OpenAI. Chaque modèle offre un équilibre différent entre le coût, la vitesse et l’intelligence, les développeurs devront donc choisir en fonction de leurs besoins et, quelque chose de moins, du budget disponible.

Tous ces mouvements arrivent à un moment où la compétition Openai est de plus en plus intense. Parmi les rivaux les plus remarquables figure Google, qui a réussi à renommer votre stratégie et à présenter des produits vraiment puissants. Dans le cas d’OpenAI, il y a encore plusieurs mouvements à spécifier dans les prochains mois.

Sam Altman a déjà avancé que cette année, ils présenteront deux nouveaux modèles: O3 et O4-MinI. Au début, O3 n’allait pas être lancé en tant que modèle indépendant, mais ses capacités Ils seraient intégrés dans les futurs modèles. Cependant, ce plan de réorganisation, conçu pour simplifier une nomenclature de plus en plus déroutante, a été une pause pour le moment.

MidJourney était le meilleur pour générer des images. Chatgpt avance sur la droite

Un exemple clair de cette confusion se trouve dans le sélecteur de modèle, où il n’est pas toujours évident dans lequel choisir. Il existe également d’autres facteurs qui n’aident pas, comme le fait que GPT-4.1 est arrivé après GPT-4.5, malgré les meilleures capacités.

Images | Openai + Photoshop

Dans Simseo | L’industrie de l’IA ne fait que violer durable les lois sur le droit d’auteur. Alors tu essaies de les éradiquer