L'IA générative est de plus en plus utilisée pour le codage de lui-même

Ces dernières années, l’intelligence artificielle générative a trouvé un nouveau domaine d’application: codage. Jared KaplanScientifique Chef d’Anthropic, souligne que le codage représente une opportunité passionnante pour les développeurs, les aidant à identifier les erreurs et à déboguer le code. Des outils comme Copilote par github, Chatte d’Openi e Gémeaux Google Deepmind est déjà assisté à des millions de développeurs dans le monde entier. Dimanche PichaiPDG d’Alphabet, a révélé que plus d’un quart du nouveau code Google est généré par l’IA, accélérant le travail des ingénieurs.

Startup avant-garde

Non seulement les grandes entreprises investissent dans des outils de codage automatisés, mais aussi de nombreuses startups entrent sur le marché. Les entreprises aiment Zencoder, Merly, Cosine, Tesl et Poolside Ils développent des solutions innovantes qui vont au-delà de la simple complétion automatique. Ces nouveaux outils sont conçus pour prototyper, tester et corriger le code, transformant les développeurs en gestionnaires qui supervisent le travail généré par l’IA.

Au-delà de l’exactitude syntaxique

La nouvelle génération d’assistants de codage vise à surmonter la simple correction syntaxique du code, visant pour s’assurer que le logiciel fonctionne comme souhaité. Alistair Pullen Di Cosin déclare que pour atteindre cet objectif, il est nécessaire de reproduire les processus de réflexion des développeurs humains. « Les grands modèles linguistiques peuvent écrire du code compilé, mais ils n’écrivent pas toujours le programme que vous voulez », explique Pullen. « Pour ce faire, il est nécessaire de recréer les processus de pensée qu’un codage humain suivrait pour obtenir ce résultat final ».

Cependant, les données sur lesquelles de nombreux assistants de codage sont basés ne capturent pas ces processus, ne représentant que le produit fini. Pour faire face à ce défi, des entreprises telles que Cosin et Poolside développent des modèles qui imitent le processus de création du code, améliorant la qualité et l’efficacité des corrections.

Zencoder a pris un groupe de vétérans des moteurs de recherche pour Créez un outil capable d’analyser une grande base de code et de comprendre ce qui est ou n’est pas pertinent. Ce contexte détaillé réduit les hallucinations et améliore la qualité du code que les grands modèles linguistiques peuvent produire, explique Andrew Filev, fondateur de Zencoder: « Nous l’appelons Repo gropming«.

Polsis crée également un ensemble de données synthétiques qui capture le processus de codage, mais est basé sur une technique appelée Rlce, ou apprentissage avec renforcement de l’exécution du code (Cosin l’utilise également, mais dans une moindre mesure).

RLCE est similaire à la technique utilisée pour faire des chatbots comme chatppt de conversateurs qualifiés, connus sous le nom de RLHF – apprentissage du renforcement de la rétroaction humaine. Avec RLHF, un modèle est formé pour produire du texte plus similaire à ce que les testeurs humains disent qu’ils préfèrent. Avec RLCE, un modèle est formé pour produire du code plus similaire à celui qui fait ce qu’il a à faire lorsqu’il est effectué.

Une différence fondamentale entre le cosinus et le bord de la piscine est que le cosinus utilise une version personnalisée de GPT-4O fournie par OpenAI, qui vous permet de vous entraîner sur un ensemble de données plus large que le modèle de base ne peut gérer, tandis que La piscine construit son grand modèle linguistique à partir de zéro.

Visions futuristes et défis actuels

Malgré les progrès, tout le monde ne partage pas l’enthousiasme pour l’utilisation de grands modèles linguistiques dans le codage. Justin Gottschlich Merly affirme que la programmation nécessite une logique inébranlable que les modèles actuels ne peuvent pas reproduire. Au lieu de former un modèle linguistique sur des exemples de code, Merly se concentre sur la logique ci-dessous. Gottschlich imagine un avenir dans lequel l’automatisation de la programmation sera essentielle pour faire face aux défis de la colonisation spatiale. Cependant, la route vers l’intelligence artificielle capable de résoudre toute tâche de calcul reste longue et complexe.

Ayant travaillé sur la génération de code depuis plus d’une décennie, Gottschlich a un problème similaire avec les modèles de langage importants. La planification nécessite la capacité de résoudre des énigmes logiques avec une précision inébranlable. Bien que de grands modèles linguistiques puissent apprendre à imiter ce que font les programmeurs humains, dans leur noyau, ils sont encore essentiellement Machines à sous statistiquedit: « Je ne peux pas entraîner un système illogique pour devenir logique ».

Le système Merly est formé sur une représentation intermédiaire, quelque chose de similaire à la notation lisible par la machine dans laquelle la plupart des langages de programmation sont traduits avant d’être effectués.

Aucun être humain n’est capable de comprendre les milliards de lignes de code des plus grands systèmes logiciels

Ces outils vous permettent également de concevoir plusieurs versions d’un système en même temps. Supposons que nous développons un logiciel qui a besoin d’un système de paiement intégré. Un assistant de codage peut être utilisé pour essayer simultanément plusieurs options – Tripes, mangue, caisse – Au lieu d’avoir à les codifier à la main un à la fois.

Génie Il peut être laissé pour corriger le bug 24 heures sur 24. La plupart des équipes logicielles utilisent des outils de rapport de bogues qui vous permettent de charger les descriptions des erreurs trouvées. Genie peut lire ces descriptions et proposer des corrections. Ensuite, un humain ne doit les revoir avant de mettre à jour le code de base.

Aucun être humain n’est capable de comprendre les milliards de lignes de code des plus grands systèmes logiciels d’aujourd’hui, et à mesure que de plus en plus de logiciels sont écrits par d’autres logiciels, la quantité de code ne peut qu’augmenter.

Cela rendra les assistants de codage essentiels qui garderont le code pour nous. Le goulot d’étranglement deviendra la vitesse à laquelle les humains pourront revoir le code généré par les machines.

Conclusions

Gottschlich n’est pas une exception avec sa vision galactique. Bien qu’ils se concentrent sur les produits que les développeurs voudront utiliser aujourd’hui, la plupart de ces entreprises visent un résultat beaucoup plus important. En visitant le site Web de Cosine, la société se présente comme « Laboratoire de raisonnement humain « . Car le codage du cosinus n’est que la première étape vers un modèle plus général, capable d’imiter la résolution des problèmes humains dans différents domaines.