La xarxa neuronal "superhumana" de Google realment pot dir l’ubicació de qualsevol imatge?

$config[ads_kvadrat] not found

El secreto de Darwin para convertirse en genio (que tú también puedes usar)

El secreto de Darwin para convertirse en genio (que tú también puedes usar)
Anonim

La cerca d’imatges és més fàcil que mai. Però si esteu intentant trobar una imatge d'alguna cosa en un lloc que no sigui completament obvi (per tant, les piràmides egípcies o l'escultura gegant de polze a París), és més difícil del que pensem, fins i tot amb la informació de geolocalització basada en el que és a la imatge.

Introduïu l’enginyer de Google anomenat Tobias Weyand i un parell de companys. Segons un article nou a la revista arXiv (pronunciat "arxiu"), el trio ha construït una màquina d'aprenentatge profund capaç de localitzar la ubicació de gairebé qualsevol foto basada únicament en l'anàlisi dels seus píxels.

Per obtenir una màquina per dur a terme una tasca com aquesta, voleu donar-li la capacitat d’intuir informació basada en pistes visuals. Es vol que pensi, és a dir, com un ésser humà.

Weyand es va proposar desenvolupar una xarxa neuronal artificial: un sistema de màquina dissenyat per imitar les vies neurològiques del cervell, que li permeten aprendre, processar i recuperar informació com una persona humana. Aparentment, aquest nou sistema, PlaNet, és capaç de superar els humans a l'hora de determinar les ubicacions de les imatges, independentment de la configuració, ja sigui en interiors o exteriors, i oferint qualsevol tipus d’indicacions visuals úniques o sense definir.

Com treballa PlaNet? Weyand i el seu equip van dividir un mapa del món en una graella que aplegava més de 26.000 formes quadrades en diferents regions, depenent de quantes imatges es van fer en aquells llocs. Llocs densos on es prenen moltes imatges en una plaça més petita, mentre que regions més grans i més remotes poden tallar quadrats més grans.

L’equip va crear llavors una gran base de dades d’imatges ja geolocalitzades: gairebé 126 milions de fotos diferents. Al voltant de 91 milions es van utilitzar com a conjunt de dades per ensenyar a PlaNet com esbrinar quina imatge es podia col·locar en quina graella del mapa del món.

A continuació, es va encarregar a la xarxa neuronal la geolocalització dels altres 34 milions d’imatges de la base de dades. Finalment, PlaNet es va establir en un conjunt de dades de 2,3 milions d’imatges geoetiquetades de Flickr.

Els resultats? PlaNet podria determinar el país d'origen per al 28,4% de les fotografies i el continent al 48%. A més, el sistema podria localitzar una ubicació a nivell de carrer per al 3,6% de les imatges de Flickr i la ubicació a nivell de ciutat per un 10,1%.

I PlaNet és millor que la majoria dels éssers humans, fins i tot els més grans. Weyand va sol·licitar a 10 persones ben viatjades per competir contra PlaNet en un joc d'ubicacions d'etiquetatge de les imatges trobades a Google Street View.

"En total, PlaNet va guanyar 28 de les 50 rondes amb un error de localització mitjà de 1131,7 km, mentre que la mitjana d'error de localització humana va ser de 2320,75 km", van escriure els investigadors. "Aquest experiment a petita escala mostra que PlaNet arriba a un rendiment sobrehumà en la tasca de geolocalitzar les escenes de Street View".

És real? Un enginyer de Google realment va desenvolupar una A.I. sistema?

Quan es tracta de geolocalitzar imatges, potser. I això no és massa sorprenent: el punt d’AI. no imita fonamentalment el cervell humà de totes maneres, sinó superar les limitacions humanes en algunes maneres específiques d’aconseguir tasques molt més difícils. Així, en aquest sentit, el que escriuen els investigadors és cert.

Tot i així, és un tram trucar a PlaNet una "xarxa neuronal". Una forma ideal d’aquest tipus de tecnologia seria capaç d’aprendre molt més que la geolocalització d’imatges. A.I. Els sistemes són capaços d’escriure similituds i jugant Super Mario, però això és una cosa petita en comparació amb un sistema ideal "mestre" que pot supervisar i mantenir de manera automàtica els elements vitals, gestionar les infraestructures del transport o l'energia, i molt més.

$config[ads_kvadrat] not found