Openai Lancia Flex Traitement, moins de coûts en échange de temps plus longs

OUpeine présent Traitement flexible, une option API (En version bêta) qui offre des coûts plus bas pour l’utilisation de modèles d’intelligence artificielle, face aux temps de réponse plus longs et parfois non disponibles. Cette décision fait partie d’une concurrence croissante avec des entreprises comme Google, qui essaient de rendre les moins chères et les plus accessibles.

Qu’est-ce que le traitement Openai Flex

Dans une étape décisive pour renforcer sa position sur le marché compétitif de l’intelligence artificielle, OpenAI a annoncé le lancement de Flex Processing, Une option qui réduit considérablement les coûts de l’utilisation des modèles d’IA, mais avec le compromis de temps de réponse plus longs et la possibilité de ressources qui ne sont pas toujours disponibles. Ce service est principalement conçu pour les tâches non critiques, qui ne nécessitent pas la disponibilité immédiate des modèles, tels que les évaluations des modèles, l’enrichissement des données et les charges de travail asynchrones.

Comment fonctionne le traitement Flex

Le traitement Flex est disponible en version bêta pour les modèles O3 et O4-Mini d’OpenAI. La grande nouvelle réside dans le réduction des coûtsavec le prix qui est démoli exactement la moitié de la version standard.

Pour le modèle O3, par exemple, le traitement Flex fournit Un coût de 5 dollars par million de jetons d’entrée (environ 750 000 mots) Et 20 dollars par million de jeton de productioncontre 10 $ par million de jetons d’entrée et 40 dollars par million de jetons de production de la version standard.

Dans le cas du modèle O4-Mini, les coûts descendent à 0,55 dollars par million de jetons d’entrée et 2,20 $ par million de jeton de sortie, Comparé à 1,10 $ par million de jetons d’entrée et à 4,40 $ par million de jetons de sortie de la version de base.

Concurrence avec Google et d’autres rivaux

L’introduction du traitement flexible survient à un moment où les prix des solutions Avant-Garde continuent d’augmenter. En réponse, les rivaux d’Openai lancent également des modèles moins chers et efficaces.

Un exemple est le modèle Flash Gemini 2.5 de Google, qui promet des performances plus élevées ou équivalentes à celles du modèle R1 Deepseek, mais à un coût inférieur pour les jetons d’entrée.

Cette concurrence croissante pousse les entreprises à s’adapter à un marché dans lequel l’efficacité des coûts est cruciale pour attirer un client de plus en plus exigeant, composé principalement de développeurs et d’entreprises qui ont besoin de solutions évolutives.

Vérification des adultes et nouvelles règles pour les développeurs

En plus de la réduction des coûts, OpenAI a également introduit de nouvelles règles pour accéder aux modèles les plus avancés. Les développeurs appartenant aux trois premiers niveaux de la hiérarchie du niveau d’utilisation devront terminer un processus de vérification d’identité pour accéder aux modèles tels que O3. Les niveaux sont déterminés sur la base des dépenses de l’utilisateur sur les services OpenAI, et l’introduction de cette mesure a pour objectif d’éviter les violations des politiques d’utilisation, ce qui a arrêté des abus potentiels des attaquants.

Conclusionle

Avec le lancement de Flex Processing, OpenAI essaie d’attirer un plus large éventail d’utilisateurs, offrant une solution à faible coût pour ceux qui ont des besoins moins urgents ou non productifs. Bien que la concurrence s’intensifie, cette décision stratégique pourrait s’avérer fondamentale pour maintenir son leadership sur le marché de l’intelligence artificielle, garantissant l’accessibilité et la flexibilité à ceux qui travaillent sur des projets de recherche, de développement et d’évaluation.