L'équipe développe une technologie d'apprentissage en profondeur de l'image pour présenter les écrans VR et AR de manière plus vivante et réaliste

L’équipe développe une technologie d’apprentissage en profondeur de l’image pour présenter les écrans VR et AR de manière plus vivante et réaliste

Crédit : Pixabay/CC0 Domaine public

L’équipe de recherche du professeur Jin Kyong-hwan du Département de génie électrique et d’informatique de l’Institut des sciences et technologies de Daegu Gyeongbuk (DGIST) a développé une technologie d’apprentissage en profondeur de traitement d’image qui réduit la vitesse de la mémoire et augmente la résolution de 3 dB par rapport aux technologies existantes.

Développée grâce à une recherche conjointe avec Choi Kwang-pyo de Samsung Research, cette technologie réduit le phénomène d’aliasing sur l’écran par rapport à la technologie d’interpolation d’image basée sur le traitement du signal existante (interpolation bicubique), produisant ainsi une sortie vidéo plus naturelle. En particulier, il peut restituer clairement la partie haute fréquence des images. Il est prévu d’afficher un écran naturel lors de l’utilisation de VR ou AR.

La technologie d’interpolation d’image basée sur le traitement du signal (interpolation bicubique) préserve les images souhaitées dans divers environnements en désignant un emplacement spécifique d’une image. Il a l’avantage d’économiser de la mémoire et de la rapidité, mais dégrade la qualité et déforme l’image.

Pour résoudre ce problème, des technologies de conversion d’images vidéo ultra-haute résolution basées sur l’apprentissage en profondeur ont été développées, mais la plupart d’entre elles sont des technologies basées sur le réseau d’intelligence artificielle convolutive, qui présentent l’inconvénient d’une estimation inexacte des valeurs entre les pixels, ce qui peut conduire à à la déformation de l’image. La technologie de réseau de neurones à expression implicite pour surmonter ces inconvénients attire l’attention, mais l’inconvénient de la technologie de réseau de neurones à expression implicite est qu’elle ne peut pas capturer les composants à haute fréquence et qu’elle augmente la mémoire et la vitesse.

L’équipe de recherche du professeur Jin Kyong-hwan a développé une technologie qui résout l’image en plusieurs fréquences afin que les caractéristiques des composants haute fréquence puissent être exprimées dans l’image, et réaffecte les coordonnées aux fréquences résolues à l’aide de la technologie de réseau neuronal d’expression implicite afin que l’image puisse être montré plus clairement.

Il peut être décrit comme une nouvelle technologie qui combine l’analyse de Fourier, qui est une technologie d’apprentissage profond de l’image, et la technologie des réseaux de neurones à expression implicite. La technologie nouvellement mise en œuvre peut améliorer les réseaux de neurones à expression implicite qui ne pouvaient pas restaurer les composants haute fréquence en résolvant les composants de fréquence essentiels lors de la restauration des images via un réseau d’intelligence artificielle.

Le professeur Jin Kyong-hwan a déclaré : « La technologie développée cette fois est excellente, car elle affiche des performances de restauration plus élevées et consomme moins de mémoire que la technologie utilisée dans le domaine de la déformation d’image existante. Nous espérons que la technologie sera utilisée pour la restauration de la qualité d’image et l’édition d’image. à l’avenir et j’espère qu’il contribuera à la fois au monde universitaire et à l’industrie. »

Fourni par DGIST (Daegu Gyeongbuk Institute of Science and Technology)