La technologie IA hyper-réaliste crée des avatars à partir d'une seule photo
L'Institut de recherche sur l'électronique et les télécommunications (ETRI) a développé une technologie d'IA hyper-réaliste qui peut créer un avatar qui parle naturellement comme une vraie personne utilisant une seule photo de portrait.
La technologie est considérée comme une interface de nouvelle génération qui permet une interaction intuitive entre les véhicules et les humains en préparation de l'ère de la conduite entièrement autonome, et devrait se propager dans l'industrie humaine numérique.
Alors que les assistants d'IA traditionnels axés sur la parole dans les environnements de bureau ou les systèmes de navigation dans les véhicules sont limités à la simple réalisation de commandes, les avatars IA hyper-réalistes d'ETRI ont des expressions faciales sophistiquées et des mouvements buccaux qui permettent des conversations naturelles et humaines.
Cela permet une interaction humaine-machine plus centrée sur l'homme, comme un conducteur de l'IA de véhicule parlant au conducteur ou interagissant avec les piétons.
Le cœur de cette technologie est un algorithme unique qui, contrairement à l'IA génératif traditionnel, apprend et synthétise sélectivement des parties du visage qui sont directement liées à l'énoncé, telles que les lèvres et le menton. Cette approche réduit l'apprentissage des informations inutile et permet des expressions faciales plus sophistiquées, y compris les formes de bouche, les dents et les rides cutanées.
ETRI a expliqué que la technologie a démontré des performances supérieures en termes de qualité visuelle synthétique et de précision de synchronisation des lèvres, comme présenté dans les principales conférences internationales telles que CVPR et AAAI.
En plus des véhicules autonomes, cette technologie peut être utilisée dans diverses industries telles que les kiosques, les compteurs de banques, les présentations d'actualités, les modèles publicitaires et devrait stimuler l'innovation dans l'industrie humaine numérique basée sur l'IA.
La section de recherche sur l'expérience des utilisateurs de mobilité d'ETRI se concentre actuellement sur les technologies d'interaction humaine-machine (HMI), et développe également des technologies d'interface de pilote basées sur l'IA qui analysent les émotions du pilote et des piétons, la fatigue, la concentration, etc.
Daesub Yoon, directeur de la section de recherche sur l'expérience des utilisateurs de mobilité, a déclaré: « À mesure que la technologie de mobilité devient plus avancée, les personnes âgées et socialement désavantagées pourraient être marginalisées. Nous espérons que cette technologie AI Avatar contribuera à améliorer la littératie numérique et rendra les services de mobilité intelligents plus accessibles à tous. »
Et le chercheur principal Daewoong Choi a également déclaré: « Nous prévoyons de faire progresser davantage notre technologie d'IA générative afin que les avatars de l'IA puissent naturellement parler et se déplacer comme de vraies personnes. À l'avenir, nous visons des interactions qui peuvent remplacer un peu de travail humain pour la commande, la consultation, et plus encore. »
La technologie est actuellement enregistrée sur le site de transfert de la technologie ETRI comme « un cadre pour la génération de visage parlante photoréaliste ». Les chercheurs poursuivront également activement le transfert de technologie et les stratégies de commercialisation dans diverses industries.
