Què passa quan s'utilitza el reconeixement facial en aus? La ciència explica

$config[ads_kvadrat] not found

Mozart - La Ci Darem La Mano (English Subtitles)

Mozart - La Ci Darem La Mano (English Subtitles)

Taula de continguts:

Anonim

Com a bevedor, havia escoltat que si prestaves molta atenció a les plomes del cap dels picoters que visitaven els teus alimentadors d'ocells, podríeu començar a reconèixer aus individuals. Això em va intrigar. Fins i tot vaig arribar a intentar fer esbossos d'aus als meus propis menjadors i havia trobat això fins a cert punt.

Mentrestant, en el meu treball de dia com a científic d’informàtica, sabia que altres investigadors havien utilitzat tècniques d’aprenentatge per reconèixer les cares individuals en imatges digitals amb un alt grau de precisió.

Aquests projectes em van fer pensar en maneres de combinar la meva afició amb la meva feina diària. Seria possible aplicar aquestes tècniques per identificar aus individuals?

Per tant, vaig construir una eina per recopilar dades: un tipus de menjar d'ocells preferit pels picots i una càmera activada per moviment. Vaig instal·lar la meva estació de seguiment al meu jardí suburbà de Virginia i vaig esperar que apareguessin els ocells.

Classificació d'imatges

La classificació d'imatges és un tema candent en el món de la tecnologia. Grans empreses com Facebook, Apple i Google estan investigant activament aquest problema per oferir serveis com la cerca visual, l’etiquetatge automàtic d’amics a les entrades de xarxes socials i la possibilitat d’utilitzar la cara per desbloquejar el telèfon mòbil. Els organismes encarregats de l'aplicació de la llei també estan molt interessats, principalment per reconèixer les cares de la imatge digital.

Quan vaig començar a treballar amb els meus alumnes en aquest projecte, la investigació sobre la classificació d'imatges es va centrar en una tècnica que contemplava les característiques de la imatge, com ara vores, cantonades i àrees de color similar. Sovint es tracta de peces que es podrien reunir en un objecte recognoscible. Aquests enfocaments eren exactes al voltant del 70%, utilitzant conjunts de dades de referència amb centenars de categories i desenes de milers d'exemples d'entrenament.

Les recents investigacions s'han desplaçat cap a l’ús de xarxes neuronals artificials, que identifiquen les seves pròpies característiques que resulten més útils per a una classificació precisa. Les xarxes neuronals es modelen molt lliurement en els patrons de comunicació entre les neurones del cervell humà. Les xarxes neuronals convolucionals, el tipus que ara estem utilitzant en el nostre treball amb els ocells, es modifiquen de manera que es va modelar en l'escorça visual. Això els fa especialment adequats per a problemes de classificació d'imatges.

Alguns altres investigadors ja han provat tècniques similars en animals. Em vaig inspirar en part per la científica informàtica Andrea Danyluk de Williams College, que ha utilitzat l’aprenentatge per identificar les salamandres individualitzades. Això funciona perquè cada salamandra té un patró distintiu de taques.

Progrés de l'identificació Bird

Mentre que els meus estudiants i jo no teníem gairebé tantes imatges per treballar com la majoria d’investigadors i empreses, vam tenir l’avantatge d’algunes restriccions que podrien augmentar la precisió del nostre classificador.

Totes les nostres imatges van ser preses des de la mateixa perspectiva, tenien la mateixa escala i cauen en un nombre limitat de categories. Tot això, només unes 15 espècies van visitar l’alimentador a la meva zona. D'aquests, només 10 van visitar-se amb la suficient freqüència com per proporcionar una base útil per formar un classificador.

El nombre limitat d’imatges va ser un handicap definitiu, però el nombre reduït de categories va funcionar a favor nostre. Quan es tractava de reconèixer si l’ocell d’una imatge era un pollet, una barrica de Carolina, un cardenal o una altra cosa, un primer projecte basat en un algoritme de reconeixement facial aconseguia una precisió del 85%, prou bo per mantenir-nos interessats en el problema.

Identificar els ocells en imatges és un exemple de tasca de "classificació gran", el que significa que l’algorisme intenta discriminar objectes que són només lleugerament diferents entre si. Moltes aus que apareixen als alimentadors són aproximadament de la mateixa forma, per exemple, de manera que expliquen la diferència entre una espècie i una altra pot ser molt difícil, fins i tot per a observadors humans experimentats.

El repte s’aconsegueix només quan intenteu identificar els individus. Per a la majoria d’espècies, simplement no és possible. Els picots que m'interessaven tenen un plomatge fortament estampat, però segueixen sent molt semblants, de manera individual a individual.

Per tant, un dels nostres grans reptes va ser la tasca humana d’etiquetar les dades per formar el nostre classificador. Em vaig adonar que les plomes del cap de les picots negres no eren una manera fiable de distingir els individus, perquè aquestes plomes es mouen molt. S’utilitzen els ocells per expressar irritació o alarma. No obstant això, els patrons de taques de les ales plegades són més consistents i semblen funcionar bé per explicar-ne una altra. Les plomes de les ales eren gairebé sempre visibles a les nostres imatges, mentre que els patrons de cap podien estar ocults en funció de l’angle del cap de l’ocell.

Al final, vam tenir 2.450 imatges de vuit picots diferents. Quan es tracta d’identificar pics individuals, els nostres experiments van aconseguir el 97% d’exactitud. No obstant això, aquest resultat necessita una verificació posterior.

Com pot això ajudar els ocells?

Els ornitòlegs necessiten dades precises sobre com canvien les poblacions d'aus al llarg del temps. Atès que moltes espècies són molt específiques en les seves necessitats d'hàbitat en matèria de cria, hivernació i migració, les dades de gra fi poden ser útils per pensar els efectes d'un paisatge canviant. Les dades sobre espècies individuals, com les picots vermells, es podrien combinar amb altres informacions, com ara mapes d’ús de la terra, patrons climàtics, creixement de la població humana, per entendre millor l’abundància d’una espècie local al llarg del temps.

Crec que una estació de monitorització semiautomàtica està a l’abast d’un cost modest. La meva estació de monitorització costa al voltant de 500 dòlars EUA. Estudis recents suggereixen que hauria de ser possible formar un classificador utilitzant un grup d'imatges molt més ampli, després afinar-lo ràpidament i amb demandes computacionals raonables per reconèixer aus individuals.

Projectes com eBird del Laboratori d'Ornitologia de Cornell han posat a l'abast d'un petit exèrcit de ciutadans científics el seguiment de la dinàmica de les poblacions, però la major part d'aquestes dades solen provenir de llocs on la gent és nombrosa i no de llocs d'interès específic per als científics.

Un enfocament automatitzat de les estacions de seguiment podria proporcionar un multiplicador de forces per als biòlegs de la vida salvatge relacionats amb espècies específiques o llocs específics. Això augmentaria la seva capacitat per recopilar dades amb la mínima intervenció humana.

Aquest article va ser publicat originalment a The Conversation de Lewis Barnett. Llegiu l'article original aquí.

$config[ads_kvadrat] not found