GenAI dati strutturati

GenAI et données structurées : comment l’IA découvre des informations cachées

Depuis deux ans, l’intelligence artificielle générative est avant tout associée à la création automatique de contenus : textes, images, assistants conversationnels. Mais la véritable frontière – encore peu explorée dans le débat business – concerne un autre domaine : l’application de GenAI aux données structurées.

De nombreuses organisations possèdent d’énormes archives : bases de données historiques, données transactionnelles, statistiques, journaux opérationnels. Cependant, ces actifs informationnels sont souvent utilisés uniquement à des fins de reporting traditionnel ou d’analyse descriptive. Le changement de paradigme se produit lorsque l’IA ne se contente pas d’interroger les données, mais découvre des relations, des modèles et des anomalies qui n’étaient pas explicitement recherchés.

Un cas emblématique vient du monde du sport professionnel, où la Ligue de basket-ball de Serie A a décidé d’enrichir et d’exploiter ses archives statistiques historiques – 78 ans de données structurées sur les matchs, les joueurs, les performances et les résultats.

L’objectif : faire évoluer une base de données statique vers une plateforme capable de générer des informations continues et du contenu capable de satisfaire la curiosité et la passion des journalistes, des techniciens et des fans.

Le 5 mai, à Milan, Infront, Lega Basket Serie A, Microsoft et Impresoft 4ward ont montré ensemble comment ils entendaient transformer la façon dont les supporters, les médias et les clubs perçoivent les données sportives.

Les fans de basket le savent bien : les statistiques ne suffisent jamais. Chiffres, curiosités, comparaisons, archives cachées. L’envie de découvrir « quelque chose de plus » fait partie intégrante de l’expérience sportive.

C’est précisément de ce besoin qu’est né le projet développé par Lega Basket Serie A (LBA) et Infront, conseiller officiel LBA, avec le soutien technologique de Microsoft et Impresoft 4ward : LUCA, un agent IA innovant capable de transformer l’héritage statistique du championnat en un flux continu d’informations, de contenus et d’histoires.

LUCA est un véritable auteur numérique, capable de générer chaque semaine du contenu prêt à être apprécié sur différents canaux :

  • idées et curiosités d’avant et d’après-match ;
  • articles éditoriaux et narration basée sur les données ;
  • contenu social.

De plus, LUCA fournit également une interface conversationnelle grâce à laquelle vous pouvez poser des questions complexes sans connaître les détails de la base de données sous-jacente ni même avoir des compétences techniques. Le résultat est un écosystème éditorial continu qui alimente le dialogue avec le public, transformant chaque match en une source inépuisable de contenus.

« Notre objectif est simple : donner aux fans exactement ce qu’ils recherchent – ​​et aussi ce qu’ils ne savent pas encore qu’ils veulent découvrir,» déclare Massimo Cortinovis qui a voulu et coordonné le projet pour LBA. « Les statistiques deviennent des histoires, et les histoires deviennent un engagement. »

D’un point de vue commercial, la valeur du projet est de créer un nouveau système éditorial qui multiplie la quantité et la qualité du contenu intéressant. En plus de représenter bientôt un nouveau service pour les parties prenantes et les fans avancés, tout cela signifie plus d’engagement et de vues sur les chaînes numériques, un meilleur profilage des utilisateurs, une meilleure audience pouvant être utilisée pour des initiatives publicitaires ciblées.

« Ce projet représente un changement de paradigme dans la façon dont nous parlons du sport », explique Stefano Deantoni, directeur marketing d’Infront Italie. « La Lega Basket Serie A est le premier partenaire à avoir cru et investi concrètement dans cette vision, en concrétisant une idée développée par Infront et en la transformant en un projet réel et déjà opérationnel. Grâce à l’IA, nous pouvons amplifier la valeur des statistiques en les transformant en récits engageants et continus, capables de renforcer le lien entre les supporters et la compétition. Nous sommes convaincus que ce modèle peut également être adopté avec succès par d’autres ligues et fédérations, en Italie et à l’étranger, offrant un outil innovant et efficace pour faire évoluer l’engagement des supporters. »

Sur le plan technologique, l’accent est mis sur l’architecture. « La valeur de l’IA ne réside pas seulement dans la capacité de générer du contenu, mais aussi dans la possibilité de le faire avec contrôle, cohérence et fiabilité », explique Daniele Grandini, directeur de l’innovation d’Impresoft 4ward. « Avec LUCA, nous avons créé un système qui connecte les données, les agents spécialisés et la validation continue, transformant les statistiques du championnat en informations et récits précieux ». Et il ajoute : « Il ne s’agit pas simplement d’utiliser l’IA, mais de le faire de la bonne manière. Nous avons construit un système qui allie créativité et contrôle. Pour ce projet, nous avons travaillé d’une part sur la définition de classes d’insights génériques qui capturent des curiosités et des statistiques vraiment intéressantes, et d’autre part sur un système d’agents d’IA capables de collaborer entre eux. »

Le système utilise les modèles gpt_51, gpt_52, gpt_52_chat, gpt_53_chat d’OpenAI et a été publié sur la plate-forme Azure de Microsoft. Et ajoute Annamaria Bottero, responsable mondiale des solutions partenaires de Microsoft Italie : « Dans le sport, les données sont essentielles mais souvent peu accessibles ; désormais, grâce à l’IA, il est possible de trouver des corrélations et des informations qui permettront aux fans de basket-ball de vivre une expérience sportive enrichie et dans l’air du temps. »

Au-delà de la génération : l’IA comme outil de découverte

Il ne s’agit pas de simples statistiques : la nuance peut paraître comme un détail mais la différence est substantielle.

Dans le paradigme le plus répandu, GenAI génère du contenu à partir d’une saisie textuelle.
Cependant, dans le modèle appliqué dans ce projet, l’IA analyse des ensembles de données structurés – relatifs à chaque match des dernières décennies et à la performance de chaque joueur – pour identifier :

  • modèles récurrents au fil du temps
  • anomalies statistiques significatives
  • corrélations entre performances individuelles et résultats collectifs
  • tendances émergentes avant qu’elles ne deviennent évidentes

En d’autres termes, il ne découvre pas de nouvelles statistiques, mais de nouvelles relations entre statistiques.

Ce type d’approche vous permet de produire des informations non triviales difficiles à trouver via des requêtes manuelles ou des tableaux de bord traditionnels.

« connaître l’inconnu » : quand l’IA trouve ce qu’on ne cherchait pas

L’une des dimensions les plus intéressantes de l’IA appliquée aux données structurées est la capacité à mettre en lumière ce que l’on pourrait définir « connaître l’inconnu »: des informations que non seulement nous ne connaissions pas, mais que nous ne savions même pas que nous devions rechercher.

Dans les analyses traditionnelles, en effet, l’être humain formule une question et interroge les données pour obtenir une réponse. L’IA, quant à elle, peut fonctionner de manière exploratoire, identifiant des modèles inattendus, des corrélations non évidentes ou des anomalies statistiquement significatives sans que personne ne les ait explicitement demandés.

Cela change radicalement de paradigme : ce ne sont plus seulement les données qui répondent à une question, mais l’IA qui suggère de nouvelles questions. En termes business, cela signifie passer d’un modèle réactif – « J’analyse ce qui m’intéresse » – à un modèle proactif – « Je découvre ce qui pourrait devenir pertinent ».

Perspectives émergentes dans le sport : pourquoi elles sont si précieuses

Ces informations sont particulièrement utiles dans le sport pour trois raisons.

D’abord parce que le sport est intrinsèquement narratif : chaque anomalie, chaque schéma inattendu peut devenir contenu, conversation, implication.

Deuxièmement, parce que les décisions sportives et managériales sont souvent prises dans des conditions d’incertitude et de pression : avoir des signaux d’anticipation ou des relations cachées peut améliorer la qualité des choix.

Troisièmement, parce que le cycle de vie d’un événement sportif est court – un match dure 90 ou 40 minutes – mais la valeur économique se construit au fil du temps. Des informations continues vous permettent d’étendre cet événement en un flux constant d’analyses, de contenu et d’opportunités commerciales.

En ce sens, l’IA ne se limite pas à analyser le sport : elle amplifie son potentiel économique et stratégique, transformant une archive statistique en une source continue de découverte.

Architecture multi-agents : ceux qui trouvent, ceux qui vérifient, ceux qui racontent

Un aspect particulièrement pertinent, également du point de vue de la gouvernance, est l’architecture adoptée.

Le système ne repose pas sur un modèle unique, mais sur une architecture multi-agents :

  • un agent spécialisé dans la recherche d’informations sur les données structurées
  • un agent de vérification, chargé de valider la cohérence et la robustesse statistique
  • un agent de transformation, qui convertit les informations en sorties utilisables (rapports, contenus, visualisations)

Cette structure réduit le risque d’erreurs d’interprétation et atténue les phénomènes tels que les biais et les hallucinations, thème central du débat actuel sur l’IA générative.

La présence d’un niveau de contrôle et de supervision humains complète le modèle, garantissant que l’IA ne soit pas laissée « seule » pour interpréter les données, mais opère dans un cadre de qualité et de responsabilité.

De l’implication à l’aide à la décision

Dans le domaine du sport, les informations générées automatiquement peuvent alimenter le contenu éditorial, accroître l’engagement et prolonger le cycle de vie de l’événement au-delà du moment de la compétition.

Mais allons au-delà de l’utilisation actuelle de LUCA : le véritable potentiel apparaît lorsque l’IA est utilisée comme outil d’aide à la décision. Avec des données structurées robustes, la même approche peut aider :

  • identifier les tendances émergentes avant qu’elles ne deviennent critiques
  • soutenir des allocations budgétaires plus éclairées
  • améliorer la planification commerciale et le marketing
  • légères corrélations entre les performances et les résultats commerciaux

La transition est claire : de la vision narrative à la vision stratégique.

Un modèle reproductible au-delà du sport

Il s’agit certainement d’un modèle reproductible pour d’autres ligues sportives, mais ce qui rend ce cas particulièrement intéressant n’est pas le secteur lui-même, mais le modèle.

De nombreuses organisations – dans des domaines tels que la finance, la vente au détail, l’assurance, les télécommunications et l’énergie – disposent de bases de données structurées extrêmement précieuses et souvent sous-utilisées.

GenAI appliqué aux données structurées peut :

  • réduire la distance entre les données et la décision
  • découvrir des liens qui ne sont pas évidents
  • transformer les magasins de données en actifs dynamiques
  • générer des informations à grande échelle avec moins de temps et d’argent que l’analyse manuelle

La véritable innovation n’est pas de générer du texte, mais de faire ressortir ce que nous ne recherchions pas explicitement.

Imaginons un agronome observant un champ. Il sait quoi rechercher, grâce à des connaissances fondées sur des années d’expérience, sur des motifs reconnus au fil du temps : taches sur les feuilles, variations de couleurs, signes évidents de stress des plantes.

Et puis on imagine un système qui observe le même champ, mais lit ce que l’œil humain n’a pas été entraîné à voir : des variations microchromatiques, des écarts minimes de croissance, des signaux faibles répartis dans l’espace et le temps. Il ne « voit pas mieux ». Il voit différemment. La différence n’est pas quantitative, elle est qualitative. L’IA rend visible quelque chose qui, bien que déjà présent dans les données, n’était pas accessible au regard humain et connecte ce qui ne nous concerne pas.

Prenons un autre exemple pratique du monde du commerce de détail. Il est possible de mettre en relation des variables qui coexistent rarement dans l’esprit d’un décideur : conditions climatiques locales, microtendances sociales, comportements passés, rythmes quotidiens. Le résultat n’est pas une « meilleure » recommandation, mais une recommandation inattendue – quelque chose que le client n’a pas exprimé, mais reconnaît immédiatement comme pertinent. Et cela vaut pour toutes les industries : l’IA ne se limite pas à optimiser des variables connues, mais découvre des relations entre des variables qui n’avaient jamais été considérées ensemble.

Conclusion : l’IA comme moteur de découverte

Le débat sur l’IA dans les entreprises risque de se concentrer sur les outils les plus visibles – chatbots, automatisation de contenu, assistants virtuels – tout en négligeant une dimension stratégique plus profonde.

L’expérience de la ligue de basket de Serie A démontre que l’IA générative peut devenir un moteur de découverte appliqué aux données structurées, capable de transformer les archives historiques en un levier d’innovation et d’aide à la décision.

La question pour les organisations et les entreprises n’est plus trivialement « que demander au chatbot » sachant déjà quoi chercher, mais : de quelles données disposons-nous qui ne parlent pas encore – et comment pouvons-nous utiliser l’IA pour les faire parler ?