Comment ChatGPT pourrait aider les premiers intervenants lors de catastrophes naturelles

Comment ChatGPT pourrait aider les premiers intervenants lors de catastrophes naturelles

Un peu plus d’un an après son lancement, les capacités de ChatGPT sont bien connues. Le modèle d’apprentissage automatique peut rédiger un essai de niveau universitaire décent et tenir une conversation d’une manière presque humaine.

Mais ses compétences linguistiques pourraient-elles également aider les premiers intervenants à retrouver les personnes en détresse lors d’une catastrophe naturelle ?

Une nouvelle étude menée par l’Université de Buffalo entraîne ChatGPT à reconnaître des emplacements, des adresses personnelles aux intersections, dans les publications des victimes de catastrophes sur les réseaux sociaux.

Fournis avec des invites soigneusement construites, les modèles GPT « guidés par la géoconnaissance » des chercheurs ont extrait les données de localisation des tweets envoyés pendant l’ouragan Harvey avec un taux de précision 76 % meilleur que les modèles GPT par défaut.

« Cette utilisation de la technologie de l’IA pourrait aider les premiers intervenants à atteindre les victimes plus rapidement et même à sauver davantage de vies », a déclaré Yingjie Hu, professeur agrégé au département de géographie de l’UB, au sein du Collège des arts et des sciences, et auteur principal de l’étude. étude, publiée en octobre dans le Revue internationale des sciences de l’information géographique.

Les victimes de catastrophes se tournent fréquemment vers les réseaux sociaux pour demander de l’aide lorsque les systèmes 911 deviennent surchargés, notamment lors de la dévastation de la région de Houston par Harvey en 2017.

Pourtant, les premiers intervenants n’ont souvent pas les ressources nécessaires pour surveiller les flux des réseaux sociaux lors d’une catastrophe, suivre les différents hashtags et décider quelles publications sont les plus urgentes.

L’équipe de recherche dirigée par l’UB, qui comprend également des collaborateurs de l’Université de Géorgie, de l’Université de Stanford et de Google, espère que leurs travaux pourraient conduire à des systèmes d’IA traitant automatiquement les données des médias sociaux pour les services d’urgence.

« ChatGPT et d’autres grands modèles linguistiques ont suscité la controverse en raison de leurs utilisations négatives potentielles, qu’il s’agisse de fraude scolaire ou de suppression d’emplois. Il est donc passionnant d’exploiter leurs pouvoirs pour le bien social », déclare Hu.

« Bien qu’il existe un certain nombre de préoccupations importantes et valables concernant l’émergence de ChatGPT, nos travaux montrent qu’un travail minutieux et interdisciplinaire peut produire des applications de cette technologie susceptibles d’apporter des avantages tangibles à la société », ajoute le co-auteur Kenneth Joseph, professeur adjoint à le Département d’informatique et d’ingénierie de l’UB, au sein de la Faculté d’ingénierie et des sciences appliquées.

Fusionner les « géoconnaissances » dans ChatGPT

Imaginez un tweet avec un message urgent mais clair : une famille, dont une personne de 90 ans qui ne tient pas debout, a besoin d’être secourue au 1280 Grant St., Cypress, Texas, 77249.

Un modèle typique, tel qu’un outil de reconnaissance d’entité nommée (NER), reconnaîtrait l’adresse indiquée comme trois entités distinctes : Grant Street, Cypress et Texas. Si ces données étaient utilisées pour géolocaliser, le modèle enverrait les premiers intervenants non pas au 1280 Grant St., mais au milieu de Grant Street, voire au centre géographique du Texas.

Hu dit que les outils NER peuvent être formés pour reconnaître des descriptions complètes d’emplacement, mais cela nécessiterait un vaste ensemble de données de descriptions d’emplacement précisément étiquetées et spécifiques à une zone locale donnée, un processus long et laborieux.

« Même s’il y a un manque d’ensembles de données étiquetés, les premiers intervenants ont beaucoup de connaissances sur la façon dont les emplacements sont décrits dans leur zone locale, qu’il s’agisse du nom d’un restaurant ou d’un carrefour populaire », explique Hu. « Nous nous sommes donc demandé : comment pouvons-nous intégrer rapidement et efficacement ces géoconnaissances dans un modèle d’apprentissage automatique ? »

La réponse était les Generative Pretrained Transformers, ou GPT, d’OpenAI, de grands modèles de langage déjà formés à partir de milliards de pages Web et capables de générer des réponses de type humain. Grâce à une conversation simple et aux bonnes invites, l’équipe de Hu a pensé que GPT pourrait rapidement apprendre à interpréter avec précision les données de localisation provenant des publications sur les réseaux sociaux.

Premièrement, les chercheurs ont fourni à GPT 22 tweets réels des victimes de l’ouragan Harvey, qu’ils avaient déjà collectés et étiquetés dans une étude précédente. Ils ont indiqué à GPT quels mots dans le message décrivaient un emplacement et quel type d’emplacement il décrivait, qu’il s’agisse d’une adresse, d’une rue, d’une intersection, d’une entreprise ou d’un point de repère.

Les chercheurs ont ensuite testé le GPT guidé par les géoconnaissances sur 978 autres tweets liés à l’ouragan Harvey et lui ont demandé d’extraire les mots de localisation et de deviner la catégorie de localisation par lui-même.

Les résultats : les modèles GPT guidés par la géoconnaissance étaient 76 % meilleurs pour reconnaître les descriptions de lieux que les modèles GPT non fournis avec la géoconnaissance, ainsi que 40 % mieux que les outils NER. Les plus performants ont été les GPT-3 et GPT-4 guidés par la géoconnaissance, suivis de ChatGPT par la géoconnaissance.

« GPT combine essentiellement la grande quantité de texte déjà lu avec les exemples spécifiques de géoconnaissances que nous avons fournis pour former ses réponses », explique Hu. « GPT a la capacité d’apprendre et de s’adapter rapidement à un problème. »

Cependant, la touche humaine, c’est-à-dire la fourniture d’une bonne incitation, est cruciale. Par exemple, GPT peut ne pas considérer un tronçon d’autoroute entre deux sorties spécifiques comme un emplacement, à moins d’y être spécifiquement invité.

« Cela souligne l’importance pour nous, en tant que chercheurs, d’enseigner le GPT de manière aussi précise et complète que possible afin qu’il puisse fournir les résultats dont nous avons besoin », a déclaré Hu.

Laisser les premiers intervenants faire ce qu’ils font le mieux

L’équipe de Hu a commencé son travail début 2022 avec GPT-2 et GPT-3, et a ensuite inclus GPT-4 et ChatGPT après le lancement de ces modèles fin 2022 et début 2023, respectivement.

« Notre méthode sera probablement applicable aux nouveaux modèles GPT qui pourraient sortir dans les années à venir », a déclaré Hu.

Des recherches plus approfondies devront être menées pour utiliser les descriptions de localisation extraites de GPT afin de géolocaliser réellement les victimes, et peut-être trouver des moyens de filtrer les messages non pertinents ou faux sur une catastrophe.

Hu espère que leurs efforts pourront simplifier l’utilisation des technologies d’IA afin que les responsables des urgences n’aient pas à devenir eux-mêmes des experts en IA pour les utiliser, et puissent se concentrer sur le sauvetage de vies.

« Je pense qu’un bon moyen pour les humains de collaborer avec l’IA est de permettre à chacun de nous de se concentrer sur ce pour quoi nous sommes vraiment bons », déclare Hu. « Laissons les modèles d’IA nous aider à accomplir ces tâches plus exigeantes en main-d’œuvre, pendant que nous, les humains, nous concentrons sur l’acquisition de connaissances et sur l’utilisation de ces connaissances pour guider les modèles d’IA. »