La parla oral fa servir la IA per a la transcripció de les llengües, i és una victòria a Google

$config[ads_kvadrat] not found

История барометра (и как он работает) — Асаф Бар-Йосеф

История барометра (и как он работает) — Асаф Бар-Йосеф
Anonim

La parla després de Google. La posada en marxa britànica es va aplegar el passat mes passat per Automatic Linguist, una potent intel·ligència artificial que pot aprendre qualsevol idioma per a la transcripció de veu a text en qüestió de dies. L’equip vol habilitar la tecnologia per a cadascuna de les aproximadament 7.000 llengües del món, amb el potencial de transformar vides.

Des del llançament de l’eina lingüística, Speechmatics ha estat treballant en Omniglot, un repte per construir un llenguatge al dia. La setmana passada, la companyia va assolir una gran fita: oficialment ha colpejat a Google, amb 72 idiomes únics en total.

El sistema utilitza l’aprenentatge automàtic per fer coincidir les dades d’àudio amb una contrapartida de transcripció. A continuació, utilitza patrons lingüístics d'altres llengües per fer el procés el més senzill possible, identificant les similituds entre sons i estructures gramaticals i aplicant-los a nous idiomes. El procés és molt eficaç: com a exemple, el treball de Speechmatics en hindi va trigar només dues setmanes a arribar al 80% de precisió. Quan es va provar el producte final contra els esforços de Google, va obtenir un 23% menys d’errors.

Invers Va parlar amb Benedikt von Thüngen, director general de Speechmatics, per obtenir més informació.

Com vau començar a treballar per primera vegada en el projecte?

Vam començar el projecte Omniglot com un repte per a nosaltres mateixos: per veure quants idiomes podríem construir en sis setmanes. Ens vam adonar que fa un temps que l’abordatge tradicional de construir cada llengua de forma individual ja no és viable si es vol escalar a un ritme ràpid. Tenint en compte això, vam haver de repensar què és una llengua, com s'estructura i quines similituds hi ha entre diferents idiomes. Hem trobat una manera d’utilitzar aquests punts comuns per identificar patrons i ajudar el nostre marc d’Alimentació Intel·ligent, el Linguista Automàtic (AL), per construir llengües més ràpides que mai - 46 en sis setmanes per ser precises, o aproximadament una llengua al dia durant sis setmanes !

Com es diferencia d’aquest esforç de Google?

El nostre enfocament per a la construcció de llengües és un dels aspectes principals que ens diferencia de Google. Tot i que assumim que construeixen les seves llengües individualment (o pel que anomenem "força bruta"), estem utilitzant el poder d’AI. per agilitzar i accelerar el procés de creació d’idiomes. A més, mentre altres serveis, com ara Google, se centren a construir dialectes en lloc d’idiomes únics, estem orgullosos de dir que els nostres esforços s’han centrat en idiomes únics de tot el món, incloses les àrees que les grans empreses tecnològiques van desorientar.

Quines són algunes de les aplicacions reals per a això?

Ara tenim la tecnologia i el coneixement per fer el nostre servei més extens que mai i portar el reconeixement de veu automàtic (ASR) a tothom. Això és especialment rellevant en països amb baixes taxes d’alfabetització, on la capacitat d’utilitzar una tecnologia de text discurs que no estigués disponible per comunicar-se pot fer la diferència per a les persones. Altres casos reals en què la tecnologia ASR pot ajudar a relacionar-se amb qüestions d’accessibilitat: les persones amb discapacitats auditives i / o visuals de tot el món poden ara utilitzar un dispositiu tan simple com un telèfon per interactuar amb els que els envolten.

Millora la precisió d’idiomes ben coberts com l’anglès?

A mesura que continuem desenvolupant més idiomes, la nostra A.I. El marc esdevindrà cada vegada més hàbil a identificar les característiques i els patrons lingüístics. Utilitzarem aquest coneixement per continuar perfeccionant la nostra base lingüística actual, inclòs l’anglès.

Podria això millorar alguna cosa com les eines de traducció en temps real de Google Pixel Buds?

Definitivament veiem projectes com Omniglot que ajuden a millorar les eines de traducció en temps real. A mesura que s'inverteix més recursos per ampliar l’abast i l’exactitud dels idiomes, veurem una millora contínua en el sector dels serveis de traducció.

Funciona amb qualsevol idioma, fins i tot llenguatges construïts com el klingon?

Encara no hem provat de construir conlangs, però no veiem cap raó per la qual no funcionen. Atès que aquestes llengües segueixen sent parlades per humans, també segueixen regles i restriccions estructurals similars com a llengües quotidianes (com el nombre de fonemes), la qual cosa donaria dades AL suficients per a una construcció.

Esteu obrint l’obtenció del projecte?

No, no tenim plans per fer-ho.

Com funcionarà la llicència?

Els idiomes oferts pel projecte Omniglot són gratuïts i no es poden utilitzar amb finalitats comercials. Com a tal, no se'ls atribuirà cap llicència per al futur previsible.

Quins són els passos següents d’aquí?

Project Omniglot és només el principi per a nosaltres. Volem, finalment, construir tots els idiomes del món, de manera que treballarem dur cap a aquest objectiu.

$config[ads_kvadrat] not found