Aquesta xarxa neuronal AI de Nvidia crea imatges falses fotorealistes

$config[ads_kvadrat] not found

T'agrada aquesta foto

T'agrada aquesta foto
Anonim

En un cop d'ull, la foto que apareix a la part superior sembla una foto ordinària d'un carrer normal, que es prenia des d'una càmera o d'alguna persona tan tonta com per passejar per la carretera per fer una imatge d’una escena tan mundana.

Però mireu una mica més a prop. Observeu com el senyal de trànsit està lleugerament deformat, o com alguns dels cotxes semblen difusos? Hi ha alguna cosa malament aquí. Això no és una fotografia en absolut. És una imatge creada íntegrament per un A.I.

Els científics informàtics de l'empresa tecnològica Nvidia i la Universitat de Califòrnia, Berkeley, han escrit un treball d'investigació, disponible en preimpressió a arXiv, detallant com van ser capaços d'obtenir una xarxa neuronal per generar imatges reals del carrer i retrats humans. Fins i tot incloïen una interfície d’usuari que us permet retocar les imatges, però us agradaria afegir fulls extra o fins i tot canviar el temps.

"El joc està creixent ràpidament, perquè la gent li agrada interactuar entre si en entorns virtuals", explica Ming-Yu Liu, científic sènior de Nvidia. Invers en un correu electrònic. "No obstant això, la construcció de mons virtuals és car amb la tecnologia actual, ja que requereix que els artistes modelitzin i simulin explícitament la textura i la il·luminació del món que construeixen. Amb la traducció de la imatge a la imatge, en canvi podem provar el món real per crear mons virtuals."

Les xarxes neuronals són ordinadors modelats per treballar com un cervell humà en obtenir informació, aplicar-la i aprendre dels resultats. Aquesta investigació va utilitzar tipus especials de xarxes neuronals introduïdes per Ian Goodfellow el 2014, anomenades xarxes contradictòries generatives, o GAN, que generalment consisteixen en dues xarxes, el generador i el discriminador.

Es dóna fotos al generador i comença a crear imatges sintètiques similars a les que se li van donar. A continuació, es mostra una barreja de les imatges que se li van donar i les falsificacions al discriminador, la tasca de la qual és separar-les. A mesura que continuï aquest procés, el generador esdevé millor quan imita les imatges originals i el discriminador esdevé millor a dir les falsificacions. Els resultats són fotos força convincents i totalment falses.

Aquesta investigació es basa en el model tradicional de GANs afegint la divisió de les xarxes de generadors i discriminadors en algunes sub-xarxes, que permeten obtenir imatges de resolució més alta. Les xarxes neuronals també són capaces d’aconseguir un mapa semàntic –o un esquema de com es pot veure la foto– i omplir les textures de manera autònoma. Fins i tot els usuaris poden entrar en el pla i canviar les coses si volen afegir edificis en lloc d’arbres en una vista de carrer o fer que els ulls s’amplien en un retrat.

El document compara els seus resultats amb experiments similars fets amb aquest mètode, sent el més notable pix2pix. L’estudi Nvidia i UC Berkeley és capaç de generar imatges amb detalls tan petits i precisos com a plaques de llicència llegibles, mentre que pix2pix produeix imatges que gairebé semblen pintures d’aquarel·les.

Tot i que aquesta eina es podria utilitzar per guanyar lliurement el karma de reddit amb un parell de fotos extravagants, els autors veuen un gran potencial en utilitzar aquest enfocament per generar gràfics realistes amb només un simple pla.

Centenars d’hores de treball minuciós van a generar mons virtuals per utilitzar-los a Google Maps, pel·lícules i videojocs. Liu diu que aquest model podria servir de manera de fer sense complicacions la major part del disseny realitzat i, a continuació, introduir i modificar els detalls més endavant.

"En lloc de representar el món modelant-lo de manera explícita, podem construir el món implícitament mitjançant la traducció de la imatge a la imatge per traduir entre un model simple del món que no conté cap textura o il·luminació i una sortida fotorrealista. Aquesta capacitat hauria de fer molt més barat la construcció de mons virtuals ", explica Invers.

Per al següent pas d’aquesta investigació, l’equip espera explorar la traducció de vídeo a vídeo, que utilitzaria xarxes neuronals per crear vídeos realistes. Un objectiu que diu Lui ha desafiat els investigadors del camp.

Ara ja saps com de fàcilment es poden crear imatges falses. No confieu en tot el que veieu a les imatges de Google.

$config[ads_kvadrat] not found