Cohere est l'OpenAI canadienne dédiée au monde des affaires. Et il fait tout le contraire de Sam Altman
En 2017, Aidan Gomez (photo, au centre) était le plus jeune d'un groupe très spécial de huit chercheurs. Tous faisaient partie de Google Brain, la division qui a fini par fusionner avec DeepMind. Et tous ont publié à l’époque l’étude la plus pertinente dans le domaine de l’intelligence artificielle depuis des années.
Cette publication, intitulée « L'attention est tout ce dont vous avez besoin », a introduit le concept de Transformer. Ce fut le déclencheur de l’émergence de modèles d’IA génératifs et de chatbots comme ChatGPT.
Gomez finira par travailler avec Geoffrey Hinton dans son laboratoire de Toronto, mais il n'y restera pas longtemps. En 2019 a décidé de fonder Cohere aux côtés de Nick Frosst (photo, à droite) et Ivan Zhang (à gauche).
Tous avaient étudié à l’Université de Toronto, et cela a fini par les rassembler pour créer une startup d’IA qui commence à faire du bruit et qui pourrait tenir tête aux grandes entreprises.
C'est ainsi que Cohere se différencie des géants de l'IA
Cohere est une entreprise canadienne d'environ 300 employés qui est devenue une alternative intéressante dans ce segment. Et c’est parce qu’il a une approche très différente de ses concurrents, et notamment d’OpenAI, avec lequel il est souvent comparé. Parce que? Trois raisons.
- Modèle SaaS. Des entreprises comme OpenAI offrent un accès à leurs modèles d'IA via une API et facturent chaque jeton généré par leurs LLM. De plus, ces entreprises exécutent ces requêtes sur des infrastructures qu'elles ont mises en place dans des infrastructures cloud comme celles de Microsoft, Google ou Amazon. Cohere propose un modèle SaaS (Software-as-a-Service) dans lequel le client dispose déjà de sa propre infrastructure, et utilise les modèles Cohere, qui facturent une commission pour cela. Comme l'explique Gomez, « cela nous permet d'avoir des marges beaucoup plus élevées, car nous ne payons pas pour l'informatique ».
- Le chatbot n'a pas (très) d'importance. Les majors de l'IA se vantent des chatbots, mais Cohere ne propose pas de produit de ce type. Ces assistants, qui profitent du modèle freemium, nécessitent une énorme infrastructure informatique et permettent certes de convaincre de nombreux utilisateurs de passer à leurs forfaits payants, mais chez Cohere ils préfèrent économiser beaucoup sur les coûts d'inférence (génération de réponses). « Nous commençons à atteindre le point d'inflexion où le coût du calcul pour l'inférence est plus élevé que celui de la formation (des modèles), ce qui indique la maturité du marché », a souligné Gomez.
- Modèles ad hoc pour les entreprises. L’autre grand point différenciant de Cohere est qu’il ne s’adresse pas aux utilisateurs finaux mais aux entreprises. Et c’est à ces entreprises qu’elle propose des modèles hautement optimisés pour des usages spécifiques. Nick Frosst a expliqué dans Business Insider comment « nous avons découvert que le réglage de petits modèles avec des ensembles de données (spécialisés) nous permet d'obtenir de grands résultats ».
Modèles petits, précis et bon marché
Cette stratégie semble se renforcer. En mars 2024, l'entreprise a lancé un modèle génératif évolutif spécifiquement destiné aux entreprises, qu'elle a baptisé Command R. Un mois plus tard, elle a lancé Commande R+une version suralimentée de ce qui précède qui offre également une fenêtre contextuelle de 128 000 jetons.
Les deux peuvent être utilisés (avec des limites et en obtenant une API d'essai gratuite) sur des plateformes comme OpenRouter ou Hugging Face, mais aussi depuis la propre plateforme de Cohere via Coral, son interface utilisateur pour évaluer ses modèles.
Dans les deux cas, Cohere promet quelque chose d'important : il utilise un système de Retrieval Augmented Generation (RAG), qui, selon eux, réduit les « hallucinations » habituelles des modèles d'IA. Pour ce faire, il inclut des citations et des références – à la manière de ce que fait Perplexity.ai par exemple – et surtout il essaie de s’adapter aux besoins spécifiques de chaque entreprise et à chaque scénario dans lequel ces modèles sont utilisés.
Cela permet des avantages importants selon les responsables de Cohere. Des tests internes ont montré que, lors de l'analyse des informations scientifiques et financières, les versions affinées de Command R étaient plus précises que leurs rivales.
Ainsi, lors de la synthèse des réunions, la précision du Command R était de 80,2 %, tandis que celle du GPT-4 était de 78,8 % et celle de Claude Opus de 77,9 %. Dans l'analyse des données financières, le modèle de Cohere était 6,2 % plus précis que celui d'OpenAI et 5,3 % que celui d'Anthropic, même si nous insistons, selon des tests internes.
Le coût est encore plus important et intéressant : l'exécution de ces modèles Cohere affinés, appelés coûts d'inférence, c'est nettement moins cher que d'utiliser OpenAI : générer un million de tokens coûte entre 2 et 4 dollars avec Cohere, mais coûte entre 30 et 60 dollars avec GPT-4.
Ce ne sont pas les seules propositions de Cohere, qui a présenté il y a quelques jours ses modèles Aya 23 8B et 35B, qui représentent un pari proche de Llama 3, avec des modèles à poids ouvert, un comportement apparemment notable et également disponibles en 23 langues différentes.
Mais il y a aussi une incertitude
En juin 2023, Cohere a annoncé un tour de table de 270 millions de dollars mené par la société d'investissement Inovia Capital, mais auquel ont également participé des géants comme NVIDIA, Oracle et Salesforce.
Cela a porté la valorisation de l'entreprise à 2,1 milliards d'euros, un chiffre remarquable. Pour autant, cet investissement est loin de ceux qui avaient été réalisés jusqu'alors dans des sociétés comme OpenAI (11,3 milliards de dollars selon TechCrunch), ou Anthropic (450 millions de dollars).
Ces dernières semaines, il a été question d'un nouveau cycle d'investissement de 500 millions de dollars supplémentaires, qui porterait sa valorisation boursière à 5 milliards de dollars. Cela donnerait encore plus de marge de croissance à l'entreprise et consoliderait son engagement envers un modèle différent des autres entreprises dans ce domaine, mais il existe également une incertitude quant à son avenir.
Surtout, pour le des revenus, encore très modestes. Selon The Information, Cohere n'a encaissé que 13 millions de dollars sur l'ensemble de l'année 2023, même si la situation s'est améliorée au début de l'année : à la fin du premier trimestre de l'année, ce chiffre était passé à 35 millions de dollars.
Ces données sont loin derrière si l’on regarde les revenus théoriques d’Anthropic et d’OpenAI. Toujours selon The Information, Anthropic générerait plus de 850 millions de dollars en 2024, tandis qu'OpenAI atteindrait 5 milliards de dollars selon les estimations.
La concurrence s'accélère également, notamment du côté des grandes entreprises, qui investissent des sommes colossales pour développer leurs modèles et les rendre accessibles à tous les publics.
La montée en puissance des modèles Open Source – bien qu'ils ne soient pas entièrement Open Source – tels que Llama 3 menace également la proposition de Cohere, notamment parce qu'elle facilite la mise en œuvre d'implémentations personnalisées si les entreprises disposent d'experts capables de les former, de les affiner et de les sécuriser. des modèles.
Cohere dispose sans aucun doute de grands atouts pour être pertinent sur ce marché de plus en plus concurrentiel, mais il sera intéressant de voir si son approche, notamment différente de celle de ses concurrents, finit par porter les fruits qu'ils attendent.
Images | Adhérer
À Simseo | C'est pourquoi Google n'a pas lancé son chatbot IA avant ChatGPT (selon l'ancien chef de produit Google Brain)