Redémarrer l'expérience
Découvrez les secrets des hypertrucages et les indices visuels vous permettant de les identifier grâce à nos recherches pratiques et à des exemples trouvés sur internet.
Détails techniques
Défauts visuels
Différence de teint de peau: le teint de la peau n'est pas le même sur le masque et le visage. Ce dernier semble recouvert d'une couche de couleurs, avec des taches et des bords.
Un hypertrucage est créé par un logiciel pouvant apprendre à recréer un visage en analysant différentes photos d'une même personne. Le logiciel colle ensuite le visage recréé sur une vidéo existante, à la manière d'un masque numérique. Les contours de ce masque sont visibles dans cette vidéo:
Vidéo cible
Vidéo l'hypertrucage
Vidéo cible pour l'hypertrucage: YouTube | AndrewSchrock | Cutest Baby Montage Ever.
Vidéo source pour l'hypertrucage: YouTube | TheFakening | Baby Elon Musk Montage Deepfake
Shia LaBeouf
Pilar
Vidéo cible source: YouTube | MotivaShian | Shia LaBeouf "Just Do It" Motivational Speech
Détails techniques
Défauts visuels
Différence de teint de peau: le teint de la peau n'est pas le même sur le masque et le visage. Ce dernier semble recouvert d'une couche de couleurs, avec des taches et des bords.
Différences dans les expressions: les expressions du visage de l'hypertrucage diffèrent de celles du visage cible. Les traits ne sont pas naturels, sont invisibles, flous ou répétés.
Bords visibles: les bords du masque sont visibles, nets ou flous tout autour du visage.
Les images de Shia utilisées pour former l'algorithme ne contenaient ni les bonnes expressions faciales ni les images de son profil requises pour recouvrir son visage dans la vidéo. Si le réseau neuronal n'est pas entraîné pour ces situations, il ne pourra pas produire de masque correct. Notez les deux bouches, dont celle de Shia qui apparaît sous le masque.
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
H64
Project reach
200
/2000 images
106000
/268000 times
64
/128 pixels
31
/63 hours
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
750
/2000 images
200000
/268000 times
128
/128 pixels
48
/63 hours
Vidéo cible source: Le diable s'habille en Prada | Entretien d’Andy
Original
Jeu de données
Masque
Alignement
Hypertrucage
Post-traitement
Choisissez une vidéo dans laquelle vous voulez coller un visage. Une vidéo stable avec un arrière-plan régulier permettra un meilleur résultat.
Enregistrez un jeu de données pour le visage que vous souhaitez coller (la source), avec la même luminosité et les mêmes expressions.
Cachez les visages des autres personnes dans la vidéo cible, sans quoi ils seront détectés par l'algorithme et perturberont son entraînement.
L'algorithme rognera les visages afin de les utiliser pour s'entraîner, tout en conservant leur position pour y coller correctement les masques par la suite.
L'algorithme génère un masque à partir du visage de la vidéo source, que vous devrez ensuite aligner sur la vidéo cible.
Un logiciel de montage vous permettra de mieux intégrer le masque et de peaufiner le résultat.
Détails techniques
Cette expérience a été réalisée avec une vidéo source exportée à deux fréquences d'affichage différentes, et les deux modèles ont été entraînés suivant la même configuration. Le nombre de cycles d'entraînement par image est le même, mais le temps d'entraînement était plus long avec le jeu de données plus important. L'algorithme ayant reçu le plus d'images produit un résultat plus fin.
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
200
/2000 images
200000
/20000
/268000 times
128
/128 pixels
8
/63 hours
Benedict Cumberbatch
Arthur
Original Vidéo cible : Sherlock | La Chute du Reichenbach | Confrontation finale sur le toit
Natalie Portman
Pilar
Original Vidéo cible : Star Wars, épisode I : La Menace fantôme | Padmé rencontre Anakin
Détails techniques
Défauts visuels
Visage flou: le masque est flou. Une différence de netteté ou de résolution est visible entre le masque et la vidéo.
Différences dans les expressions: les expressions du visage de l'hypertrucage diffèrent de celles du visage cible. Les traits ne sont pas naturels, sont invisibles, flous ou répétés.
Contours du profil: le visage vu de profil ne coïncide pas au profil cible. Le masque ne fonctionne pas, manque de détails ou n'est pas bien aligné.
Une vidéo comporte bien plus de nuances faciales que les images prises sur Facebook. Notre collègue a choisi les photos qu'elle a publiées sur les médias sociaux, il manque donc les images nécessaires à la reproduction de certaines expressions faciales. Certaines technologies avancées peuvent créer ces expressions, mais sans un jeu de données varié, le résultat ne sera jamais convaincant.
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
165
/2000 images
215000
/268000 times
128
/128 pixels
44
/63 hours
Détails techniques
Défauts visuels
Visage flou: le masque est flou. Une différence de netteté ou de résolution est visible entre le masque et la vidéo.
Effet de clignotement: le masque semble clignoter de temps en temps. L'algorithme ne reconnaît pas bien le visage et cesse de générer le masque un court instant.
Mauvaise perspective: la perspective du masque est différente de celle de la vidéo. La distance focale n'est pas la même dans les vidéos source et cible.
L'hypertrucage a été exporté à une résolution de 64 px. Grâce à cette faible résolution, l'entraînement de l'algorithme a été plus rapide, car il n'avait qu'à créer une image d'une résolution équivalente. Cette faible résolution est visible sur les plans rapprochés.
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
1400
/2000 images
100000
/268000 times
64
/128 pixels
8
/63 hours
Harrison Ford
Andrej
Original Vidéo cible : Indiana Jones et le Temple maudit | Le combat sur le pont
Bill Hader
Arnold Schwarzenegger
Original Vidéo cible : Bill Hader Presents: Schwarzenegger Baby
Vidéo source: YouTube | Ctrl Shift Face | Bill Hader impersonates Arnold Schwarzenegger [DeepFake]
Détails techniques
Défauts visuels
Occlusion du visage: lorsque des objets passent devant le visage, le masque se déforme ou les recouvre.
L'intégration du visage, la carnation et la résolution sont très bonnes. Le plan d'ensemble réduit les effets de flou. La postproduction est excellente. Le seul indice révélateur intervient lorsque Bill Hader passe son doigt devant son visage et qu'il disparaît derrière le masque. La différence de netteté et l'angle du doigt suggèrent une tentative de cacher cet effet en postproduction.
Détails techniques
La durée de l'entraînement correspond à la répétition du traitement des images par l'algorithme. Ce procédé comprend la création d'un visage (le masque numérique), sa comparaison à l'image source et les ajustements afin de renforcer les ressemblances. Le modèle effectue ce cycle une fois pour chaque image source, puis recommence. La durée d'un cycle dépend de la puissance de l'ordinateur utilisé.
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
Project reach
400
/400
/2000 images
20000
/268000 times
128
/128 pixels
4
/48
/63 hours
Constance Wu
Yueling
Original Vidéo cible : YouTube | The Late Show with Stephen Colbert | Constance Wu Explains What "Couture" Means
Arthur
Andrej
Détails techniques
H128 est le modèle le plus simple. Il produit plus rapidement un bon masque. Le masque le plus précis de SAEHD gère mieux la main et la luminosité. H128 semble mieux entraîné pour créer le visage : le masque est plus net, plus stable et fonctionne mieux avec les mouvements et les changements de perspective. Toutefois, selon les expert·es, SAEHD surpasserait H128 avec un entraînement plus long.
Algorithm
Dataset size
Iteration amount
Output resolution
Training time
SAEHD
H128
Project reach
500
/500
/2000 images
150000
/150000
/268000 times
128
/128 pixels
24
/40
/63 hours
Détails techniques
La reconstitution d'un visage nécessite beaucoup plus de puissance de calcul, mais est plus difficile à déceler. La plupart des difficultés posées par les vidéos sources n'affectent pas ce procédé, mais l'algorithme fonctionne de manière similaire. Les parties reconstituées seront légèrement floues et moins détaillées.
Prêtez aussi attention au son et guettez les défauts ou les problèmes de synchronisation labiale. Demandez-vous si une vidéo est susceptible d'être ciblée et si elle serait adaptée à un potentiel hypertrucage. En cas de doute, vérifiez la source de la vidéo.