Les images de l'IA ne parviennent pas à représenter les nuances culturelles de l'architecture islamique, selon une étude
Les images générées par l'intelligence artificielle (IA) ont révolutionné les processus de conception architecturale, offrant aux architectes l'agilité nécessaire pour produire des conceptions hautement sophistiquées et imaginatives.
Cependant, dans des domaines imprégnés de culture, de sensibilité et de religion, comme dans le cas de l'architecture islamique, les représentations générées par l'IA ne parviennent généralement pas à présenter correctement la compréhension nuancée des éléments historiques islamiques et de leurs interprétations, selon une étude publiée dans la revue. Bâtiments.
« Ces dernières années, l'adoption généralisée de générateurs d'images IA comme Stable Diffusion et Midjourney a révolutionné les processus de conception architecturale, offrant aux architectes la possibilité de produire des conceptions sophistiquées et imaginatives, » » déclare l'auteur principal de la recherche, le Dr Ahmad W. Sukkar, scientifique au département de génie architectural de l'université de Sharjah.
Cependant, et malgré le potentiel de l'IA en matière de conception innovante, « de nombreux exemples trouvés en ligne révèlent un mélange de connaissances historiques limitées et d’insuffisances dans les ensembles de données utilisés par les générateurs d’images d’IA. Dans des domaines aussi sensibles sur le plan culturel et historique que l’architecture islamique, l’intégration de la technologie de l’IA nécessite une attention particulière. »
Les modèles d'IA comme Stable Diffusion et Midjourney prétendent exceller dans la création d'images et de conceptions artistiques et architecturales avec des qualités nuancées, riches en textures et en détails, en plus de leur capacité à créer du contenu stylisé et des images visuelles réalistes. Ils aident les artistes et les architectes à produire des images photoréalistes uniques à partir de textes et d'images.
Les auteurs reconnaissent que les outils d’IA sont capables de générer des conceptions inspirées des styles d’architecture islamique traditionnels, mais estiment en même temps que naviguer à l’intersection de l’IA et de l’architecture islamique présente aux architectes à la fois des opportunités et des défis.
Ils écrivent, « Les générateurs d’images IA peuvent être un outil précieux dans le processus de conception de l’architecture islamique ; il faut cependant les utiliser avec prudence. Même si l’IA peut offrir de nouvelles possibilités et inspirations, elle doit être soutenue par une expertise humaine et une compréhension approfondie des principes et des traditions de l’architecture dans le contexte islamique.
« La touche humaine, le savoir-faire et la sensibilité culturelle qui font partie intégrante de l'architecture dans ce contexte doivent être préservés et ne pas être négligés. Il est crucial de trouver un équilibre, et l’IA doit être considérée comme un outil avancé permettant d’augmenter la créativité humaine plutôt que de la remplacer entièrement.
« Les images générées par l’IA peuvent ne pas capturer les aspects immatériels du patrimoine, tels que les pratiques culturelles, les rituels ou les traditions orales, car ceux-ci vont souvent au-delà de la perception empirique et englobent des dimensions symboliques. Dans son stade actuel de développement, l’IA a du mal à capturer pleinement la profondeur et la complexité de ces éléments, qui sont souvent étroitement liés aux expériences personnelles et subjectives. »
Dans le cadre de leurs recherches, Sukkar déclare : « Nos recherches ont exploré l’intersection fascinante de l’intelligence artificielle (IA) et de l’architecture islamique, explorant comment les technologies d’IA peuvent générer des images du patrimoine architectural islamique. Notre enquête révèle à la fois l’immense potentiel et les limites importantes de ces systèmes d’IA.
« Grâce à un examen minutieux et à une comparaison avec des sources historiques, nous avons identifié plusieurs facteurs qui contribuent à ces écarts, notamment les limitations du message utilisé pour générer les images, les difficultés liées à la capture précise des styles régionaux et historiques et les difficultés liées aux éléments et détails architecturaux. »
Les recherches de l'auteur sont ornées d'images brillantes et fascinantes de certaines des merveilles architecturales islamiques les plus renommées. Ils démontrent leurs découvertes en présentant une image IA parallèle à des représentations naturelles et originales de la même structure et soulignent les différences.
Les auteurs ont jusqu’à présent publié deux recherches examinant les défis posés par les images de l’architecture islamique générées par l’IA. Ils présentent leur cadre théorique dans l’un, puis opérationnalisent leur théorie dans l’autre.
Ils recommandent de lire d'abord leur article théorique, puis leur essai pratique dans lequel ils clarifient leur cadre conceptuel avec divers exemples pratiques d'images générées par l'IA en comparaison et en parallèle avec des photographies originales.
La recherche est réalisée conjointement par des scientifiques de l'Université de Sharjah issus des départements d'ingénierie architecturale, des beaux-arts, de design appliqué et d'informatique.
Dans les deux études, les auteurs dotent les représentations ou modèles générés par l’IA de « un potentiel important pour les architectes, les spécialistes et les utilisateurs quotidiens. » Ils soutiennent que la technologie ne parvient pas à englober l’inclusivité et la diversité, ce qui pose une limitation importante aux utilisateurs du monde entier.
« En d’autres termes, l’incapacité d’obtenir des représentations visuelles précises de points de repère spécifiques entrave l’utilisation significative de la technologie. La raison sous-jacente de cette limitation réside en partie dans l'ensemble de données de formation générique des programmes et services d'intelligence artificielle générative comme Midjourney, qui manque de reconnaissance adéquate des variations régionales et culturelles, » ils écrivent.
Lorsqu'on lui a demandé ce qui l'avait poussé, ainsi que ses co-auteurs, à aborder un sujet aussi sensible, le Dr Sukkar a répondu : « En soulignant les limites actuelles des représentations de l’architecture islamique générées par l’IA, nous visons à encourager la poursuite de la recherche et du développement dans ce domaine.
« En fin de compte, notre travail contribue à une compréhension plus approfondie de la relation évolutive entre la technologie et le patrimoine culturel, ouvrant la voie à des représentations plus précises et plus fidèles des traditions architecturales islamiques à l'ère numérique.
« Bien que ces outils aient été largement utilisés pour générer des conceptions inspirées des styles architecturaux islamiques traditionnels, naviguer à l’intersection de l’IA et de l’architecture islamique présente à la fois des opportunités et des défis. Cette avancée technologique a suscité des discussions et des débats entre universitaires et concepteurs, soulignant la nécessité d’une compréhension nuancée de l’architecture islamique historique et de son interprétation à travers des processus de conception modernes basés sur l’IA. »
Par exemple, le Dr Sukkar fait l'éloge des générateurs d'IA texte-image qui, selon lui, peuvent créer des images visuellement saisissantes inspirées de l'architecture islamique. « ils ne parviennent souvent pas à représenter avec précision les structures originales. »
Les auteurs classent les limites des images générées par l’IA en quatre groupes :
- contraintes de l'invite
- problèmes avec la représentation du cadre
- les défis liés à la capture des styles régionaux et historiques
- difficultés avec les éléments et les détails architecturaux.
Élaborant sur les principales contraintes des technologies d'image générées par l'IA, le Dr Sukkar les relie au type d'instructions données aux modèles disponibles, connues sous le nom d'invite qui « ne parviennent parfois pas à fournir suffisamment de contexte ou conduisent spécifiquement à des interprétations inexactes.
« Les images générées par l'IA peuvent ne pas capturer pleinement la diversité des styles et des caractéristiques architecturaux présents dans l'architecture islamique en raison des limitations de l'ensemble de données utilisé pour la formation. L’IA peut avoir des difficultés à reconnaître et à reproduire les caractéristiques uniques des différentes régions et périodes historiques de l’architecture islamique.
« L’IA peut avoir des difficultés à reconnaître et à reproduire les caractéristiques uniques des différentes régions et périodes historiques de l’architecture islamique, ce qui donne lieu à des représentations génériques ou trop simplistes.
« Les générateurs d'images d'IA peuvent avoir du mal à restituer avec précision des éléments et des détails architecturaux complexes, entraînant une perte d'authenticité et de fidélité des images générées.… avoir du mal à restituer avec précision des éléments et des détails architecturaux complexes. »
La recherche a des implications pour le grand public, car elle sensibilise aux pièges potentiels de s’appuyer uniquement sur les images générées par l’IA à des fins de divertissement ou de fantaisie. Les auteurs exhortent les utilisateurs à adopter une approche plus critique pour comprendre la signification historique et culturelle de l'architecture islamique, en promouvant l'exactitude et le respect du patrimoine dans les médias populaires et le discours en général.
En mettant en lumière les lacunes actuelles des représentations de la tradition architecturale islamique générées par l’IA, les auteurs espèrent que leurs recherches contribueront à la préservation du patrimoine architectural islamique et à une meilleure compréhension de sa signification.
« Conscients de ces limites, nous ouvrons des pistes pour améliorer les reconstructions virtuelles et les efforts de préservation numérique dans le domaine du patrimoine architectural, » ajoute le Dr Sukkar.