Per què A.I. Es pot lluitar per entendre l'àrab

$config[ads_kvadrat] not found

Perqu Loyalty Concept Video

Perqu Loyalty Concept Video
Anonim

Al món de la intel·ligència artificial, les dades són el rei. Com més gran tingui, millor que les eines es converteixin en sistemes capaços d’aprendre més sobre què esperar. Però depenent de la plataforma l'AI. d’establir dades, alguns idiomes poden estar millor representats que altres, segons Miriam Redi, investigadora de Yahoo Labs.

"Per exemple, com Flickr, d'on treiem les nostres dades, alguns idiomes són molt poc representats", va dir Redi, que va parlar a la Cimera Deep Learning de Londres el dijous. "Així que tenim l'anglès, milions d'imatges per a l'anglès, però tenim potser 100.000 per a l'àrab".

L’equip de Redi està treballant en una eina que permet identificar elements no visibles a les imatges, com a valors culturals i connotacions emocionals. L'eina analitza el text adjunt a les imatges disponibles al públic a Flickr. Amb el temps, l'AI. comença a entendre per què algú pot etiquetar una imatge "feliç festa" o "moment incòmode", però aquestes idees creixeran cada vegada més a mesura que l’eina analitza més imatges.

"Desgraciadament, la precisió per a la detecció de sentiments a les imatges de llengües àrabs sol ser menor perquè no tenim prou dades", va dir Redi.

En els idiomes que disposaven de quantitats més grans de dades, l’equip de Redi va notar alguns patrons interessants. Les llengües romàniques, com ara el francès i el castellà, solien expressar-se de manera similar, mentre que l'italià semblava ser l'única llengua on els usuaris identificaven imatges amb el terme "evasió fiscal".

Les barreres lingüístiques segueixen sent una cosa un problema per a A.I. investigadors. Qualsevol que hagi utilitzat Google Translate sabrà que canviar d'idiomes no és mai tan senzill com sembla. No obstant això, els nous desenvolupaments estan canviant les coses, amb Facebook anunciant aquest estiu que s'estava acostant al seu somni d'una xarxa social d'una sola llengua, traduint automàticament textos per als usuaris.

Els avenços en l'eliminació de les barreres lingüístiques poden ajudar a fomentar la comunicació internacional, però per a projectes com Redi, no hi ha cap substitut real per a les dades de confiança generades per humans.

$config[ads_kvadrat] not found