L’IA à l’épreuve du travail réel et la revanche des compétences humaines

Une IA peut-elle remplacer un professionnel humain sur une mission réelle, du début à la fin ? C'est la question au cœur de Indice du travail à distanceune étude menée par Scale AI et le Center for AI Safety pour évaluer les capacités opérationnelles des principaux systèmes d'intelligence artificielle.

Les chercheurs ont collecté des centaines de projets publiés sur des plateformes de freelancing, des emplois pour lesquels de vraies personnes avaient été payées : animations 3D de produits, transcriptions musicales, jeux web, tableaux de bord interactifs, mise en page d'articles académiques. Chaque tâche a ensuite été assignée à des modèles comme ChatGPT, Gemini de Google et Claude d'Anthropic, sans aucune intervention humaine.

Le résultat est frappant : le meilleur système n’a réalisé avec succès que 2,5 % des projets. « Les modèles actuels sont loin d'automatiser les véritables emplois de l'économie », a expliqué Jason Hausenloy, l'un des auteurs de l'étude.

Erreurs triviales, limites structurelles

Les échecs n’étaient pas marginaux. Près de la moitié des emplois créés par l’IA étaient de mauvaise qualité ; plus d'un tiers restaient incomplets. Dans environ un cas sur cinq, des problèmes techniques fondamentaux sont apparus, tels que des fichiers corrompus ou des résultats inutilisables.

Selon les chercheurs, il y a deux causes principales. Le premier est l’absence de mémoire à long terme : les modèles n’apprennent pas de leurs erreurs au fil du temps, ils ne se souviennent pas des retours reçus des jours ou des semaines auparavant. Le deuxième est une faible compréhension visuelle, cruciale pour des activités telles que le graphisme, le design et la modélisation tridimensionnelle.

Un exemple emblématique est la création d'un tableau de bord sur Rapport sur le bonheur dans le monde. Les versions générées par l’IA semblaient initialement correctes, mais une analyse approfondie a révélé des données manquantes, des textes qui se chevauchaient et des légendes mal colorées ou absentes.

Le problème des outils (et du jugement)

Comme le souligne Graham Neubig, professeur à l’Université Carnegie Mellon, l’IA n’utilise pas les mêmes outils que les professionnels humains. Un designer travaillerait avec un logiciel visuel ; un chatbot essaie plutôt de résoudre le problème en écrivant du code.

Cela reflète la manière dont les modèles sont entraînés, mais met également en évidence une limitation pratique : ils savent générer du code, mais ont du mal à évaluer si le résultat final satisfait réellement une requête. « Le code est bon ou mauvais, mais la conception visuelle est très subjective », souligne Neubig.

Malgré cela, les chercheurs notent une amélioration progressive. Des tests récents sur Gemini 3 Pro montrent un taux de complétion allant jusqu'à 1,3%, contre 0,8% pour la version précédente. « Les lignes de tendance sont là », affirme Hausenloy, même si le remplacement à grande échelle reste lointain.

Parce que les soft skills valent plus que le code

La deuxième étude aborde la question sous un autre angle : non pas ce que l’IA peut faire, mais quelles compétences sont réellement récompensées sur le marché du travail. S'appuyant sur et mettant à jour une célèbre analyse de 2017 de l'économiste de Harvard David Deming, la recherche montre qu'au cours des dernières décennies, les compétences sociales ont généré des rendements croissants, supérieurs à ceux des compétences purement mathématiques.

L'analyse, qui s'étend sur la période 2019-2023, combine les données du recensement américain etEnquête sur la communauté américaine avec des informations détaillées sur les compétences requises par les différentes professions. Le résultat est contre-intuitif : les emplois qui croissent le plus en termes d’emploi et de salaires sont ceux qui combinent des compétences quantitatives et des compétences relationnelles telles que la communication, la coordination, la persuasion et la négociation.

Un tournant historique dans le travail qualifié

Aujourd’hui, les professions dotées de fortes compétences générales mais peu mathématiques – comme les avocats, les thérapeutes et les infirmières – obtiennent de meilleurs résultats que les rôles à forte intensité numérique mais plus isolés socialement, comme les assistants statisticiens ou les programmeurs « purs ». C’est le renversement d’une tendance historique : en 1980, c’est exactement le contraire qui s’est produit.

Même au sein du secteur technologique, les rôles combinant programmation, créativité et collaboration sont florissants. Les mathématiciens et les actuaires, qui utilisent mal leurs compétences sociales, obtiennent de moins bons résultats que les développeurs de logiciels, dont la valeur réside souvent dans le travail d'équipe et la résolution créative de problèmes.

L'IA n'élimine pas le travail, elle le redéfinit

Prises ensemble, les deux études racontent une histoire cohérente. L’IA a aujourd’hui du mal à effectuer des tâches complexes de manière autonome. Mais en même temps, cela rend les activités quantitatives de plus en plus automatiques et peu coûteuses. Cela ne supprime pas des emplois, mais cela change l'économie : un jeu vidéo créé par un humain à l'épreuve de Indice du travail à distance cela a coûté 1 485 $ ; la version AI – basée sur Sonnet – moins de 30.

La véritable « compétence à l’épreuve de l’IA » n’est pas d’écrire du code, mais de savoir comment l’utiliser pour construire quelque chose avec d’autres. Dans un marché où les fonctions et les formules deviennent routinières, la valeur humaine se déplace vers ce que les machines ne peuvent toujours pas faire : comprendre les contextes, collaborer, créer du sens.