Microsoft crée une IA pour transformer des photos en visages parlants
Des chercheurs de Microsoft ont développé un outil d’intelligence artificielle capable de transformer une image de visage et un extrait audio en une vidéo très réaliste d’un « visage parlant », selon un document publié par la grande entreprise technologique cette semaine.
Objectif éthique de l’outil
La société a souligné que « l’objectif de l’outil n’est pas de créer du contenu dans le but de tromper ou de manipuler », précisant que « l’outil, comme d’autres techniques de création de contenu, pourrait être utilisé à des fins malveillantes et d’usurpation d’identité ».
Préoccupations concernant l’IA générative
La croissance rapide de l’intelligence artificielle générative, qui permet de produire facilement divers types de contenus (texte, images, sons, etc.) de haute qualité, suscite de nombreuses préoccupations, en particulier en ce qui concerne l’exploitation à des fins de fraude et de tromperie.
Engagement éthique de Microsoft
Microsoft a affirmé que « nos recherches se concentrent sur (…) les avatars symboliques virtuels, dans un but d’utilisation positive », ajoutant « nous nous opposons à tout comportement visant à créer un contenu trompeur ou nuisible ».
Utilisation responsable de la technologie
La société technologique, qui est un investisseur majeur dans « Open AI », le créateur du programme « GPT-3 », n’a pas l’intention de rendre l’outil disponible ni de fournir d’informations techniques « tant que nous ne sommes pas certains que l’outil sera utilisé de manière responsable selon les lois en vigueur ».
Fonctionnement de l’outil « VASA-1 »
Le programme appelé « VASA-1 » capture une simple image de visage, enregistre un extrait sonore, et les transforme en une vidéo montrant un visage en mouvement et parlant de manière très réaliste.
Autres entreprises travaillant sur cette technologie
D’autres entreprises explorent cette technologie, comme « Runway », une société spécialisée dans l’intelligence artificielle générative pour la vidéo. Des chercheurs de Google ont également créé un programme d’intelligence artificielle appelé « Flogger » capable de créer des vidéos réalistes de visages parlants.
Les bénéfices de l’outil selon Microsoft
Microsoft a souligné que les avantages de cette innovation, tels que « renforcer l’égalité dans l’éducation, aider les personnes ayant des difficultés de communication, et offrir un soutien thérapeutique à ceux qui en ont besoin », justifient le travail effectué dessus.