La nova tecnologia pot intercanviar expressions facials en temps real

$config[ads_kvadrat] not found

How Far is Too Far? | The Age of A.I.

How Far is Too Far? | The Age of A.I.
Anonim

Recordeu que l’aplicació "Myidol" de Bizarro World, que va arribar a ser viral aquesta primavera a causa de la seva capacitat d’utilitzar un programari de reconeixement facial per crear un avatar digital que es veu i es mou exactament sobretot com tu? Això està a punt de convertir-se en una realitat … una mica.

Els investigadors de Stanford han descobert com transferir les expressions facials d'una persona a una altra persona en temps real a través de vídeo.

El model que es mostra al vídeo de demostració de Stanford només utilitza una PC de qualitat i una càmera de profunditat per a cada actor; és a dir, que no necessiteu equipament de luxe per executar aquest tromp l'oeil. Només necessiteu algorismes complexos.

Els investigadors van desenvolupar un nou algoritme en temps real que porta imatges de gran qualitat de les cares de cada participant i les utilitza per transposar les expressions d'un "actor font" (la persona que proporciona les expressions facials i / o la parla) a un "actor objectiu" (la persona la cara del qual serà manipulada segons el que fa l’actor font). La informació visual de l'actor principal passa pel programa i es visualitza a la part superior de la seqüència de vídeo de l'actor objectiu, de manera que sembla que el actor objectiu està somrient, parlant, enganxant la llengua o tot el que em ve al cap.

Gràcies a una sèrie de punts de referència traçats al voltant de la cara (similar a l'aplicació Myidol), els tipus d'informació visual mesurats pel sistema inclouen la forma i les característiques de la cara (com els vostres ulls, el nas, la boca i fins i tot les arrugues), així com textura i profunditat facials. Aleshores, el programa coincideix amb els punts de referència de l’actor font amb l’actor d’orientació i superposa aquestes expressions al destinatari d’un canal de vídeo hiperrealista.

Atès que aquest sistema encara està en funcionament (i s’utilitza un equipament bastant rudimentari), els resultats finals segueixen sent una mica estranys: com els dents falsos semi-perturbadors, el programa se superposa a la boca de l’objectiu, de manera que no hi ha un forat negre quan sigui " oberta "(vegeu més amunt) … així com el tipus d’aspecte en blanc als ulls de l’objectiu. Però aquestes són patates fregides en comparació amb les coses interessants que suposa per a nosaltres el desenvolupament d'aquest programa.

Aquí teniu algunes idees sobre el que podríem utilitzar per a aquesta tecnologia:

  • Teniu una entrevista de treball important a Skype i no esteu vestits per tenir èxit. N'hi ha prou amb fer servir un aspecte de fantasia mentre proporcioneu les expressions facials i les respostes d’entrevistes assassines.
  • Esteu veient una conferència transmesa en directe per un professor de primer nivell a Alemanya: l’únic problema és que no parleu alemany. No us preocupeu, gràcies a un traductor en temps real que utilitza aquest programari, podeu veure el prof lliurar el seu discurs en la vostra llengua nativa sense cap retard atroz en el doblatge de les imatges.

Mireu l’expressió-intercanvi en acció:

$config[ads_kvadrat] not found