celui qui détecte et corrige lui-même les erreurs de code
La programmation ne sera plus jamais la même. Pas depuis que des outils comme GitHub Copilot ont commencé à démontrer qu’une partie du travail pouvait être effectuée par des machines. Le succès de ces solutions devient plus évident dans ce domaine, et maintenant une autre nouvelle solution prometteuse appelée Devin est apparue, et elle est développée par Cognition Labs.
Ingénieur logiciel robotique. Ses créateurs l'appellent « le premier ingénieur logiciel en IA » et se vantent de la façon dont Devin surpasse de loin ses autres concurrents dans les tests SWE-Bench. Ils évaluent le comportement de différents LLM lors de la correction de problèmes et de pull request de référentiels Python très populaires, et selon les tests, cet agent d'IA est capable de surpasser Claude 2, Llama ou GPT-4, entre autres.
Il le cuisine, il le mange. Le PDG de Cognition Labs, Scott Wu, a expliqué dans sa présentation qu'il suffit de décrire le problème à Devin et qu'il s'occupera de tout. Il consulte les API et le code, et dispose d'une console, d'un IDE et de son propre navigateur pour évaluer l'ensemble du processus. Il est capable de détecter les erreurs, de modifier le code et de le tester pour vérifier que l'erreur est résolue. L'automatisation est surprenante et démontre une fois de plus la capacité de ces agents autonomes.
Un programmeur des plus solvables. Dans les exemples partagés par Wu et son équipe dans le fil Twitter Dans un premier temps, nous voyons comment Devin est capable « d'apprendre » à générer des images qui cachent du texte à l'intérieur, mais aussi comment ils sont capables de contribuer à des référentiels de code déjà matures et qui, par exemple, contiennent des erreurs. Dans un exemple supplémentaire, Devin Il a fait le travail et résolu un problème payant sur la plateforme Upwork.
Une autre menace pour les développeurs. Certains programmeurs sont déjà clairs sur le fait qu'il s'agit d'une nouvelle étape dans cet avenir théorique dans lequel une partie de leur travail sera effectuée par des machines. Est ce que souligne Adam Rackisqui est développeur chez Spotify et qui a expliqué que « l'époque où il fallait obtenir son diplôme en huit semaines après un bootcamp où l'on apprenait React et obtenait ensuite un emploi avec un salaire de 200 000 $ est révolue ».
Il est basé sur GPT-4. C'est curieux, car la solution créée par Devin n'est pas vraiment originale : selon certains expertsses créateurs l'ont construit autour de GPT-4, et profitent de toutes les capacités de ce LLM et les appliquent spécifiquement à ce scénario pour les programmeurs.
Il y a un petit investissement derrière. Il semble raisonnable de penser que Devin s'appuie effectivement sur GPT-4 : l'entreprise a reçu un investissement de 21 millions de dollars du Founders Fund, une société de capital-risque cofondée par Peter Thiel, mais ce montant, bien que pertinent, est faible pour ce que est généralement traité dans ces zones et n'est pas loin ce qui permettrait de créer un modèle comparable au GPT-4 à partir de zéro.
Images | Danial Igdery
À Simseo | Code Llama 70B est le nouveau modèle d'IA de programmation de Meta. Il est à un pas de dépasser GPT-4