Pregunti a Siri: Com ensenya Apple A.I. el nom del vostre restaurant preferit

$config[ads_kvadrat] not found

Xiaomi + HomeKit через Siri Быстрые Команды Shortcuts сценарий голосовое управление Mi Home

Xiaomi + HomeKit через Siri Быстрые Команды Shortcuts сценарий голосовое управление Mi Home
Anonim

Apple intentant fixar una barrera tant per al llenguatge com per al comerç que existeix actualment entre els usuaris i Siri: tenir l'AI. reconeix realment noms d’empreses locals. El seu pla? Donar accés al sistema al coneixement de la geolocalització dels usuaris perquè entengui els restaurants, les botigues i les ferreteries en barris específics.

Apple ha qualificat aquesta tècnica de "models de llenguatge basats en geolocalització", o Geo-LM per resum. I en una entrada del bloc de dijous a la Machine Learning Journal de la companyia, l'equip de reconeixement de veu de Siri va explicar que utilitzarien això per obtenir informació sobre la vostra peça de pizza local en comptes de respondre amb la marca registrada: "Ho sento, no ho vaig aconseguir."

Siri és un sistema de reconeixement de veu automàtic (ASR) format per dues unitats, un model acústic i un model de llenguatge. El primer captura les paraules i els sons fets quan algú parla, mentre que el primer determina la probabilitat que hi hagi una sèrie de paraules en la llengua que es parla. En síntesi, Siri té, en el millor dels casos, una suposició educada per entendre el que estàs demanant.

Apple va identificar dues deficiències interessants. En primer lloc, certes paraules i noms que s’utilitzen per a les empreses no s’utilitzen en el diàleg estàndard, de manera que poques vegades apareixen a les dades d’entrenament del sistema i no pot indicar com els usuaris pronunciaran aquestes paraules o noms.

En un intent de solucionar-ho, Geo-LM donarà accés a Siri al que el bloc anomena "noms d’entitats". D'aquesta manera, l’assistent de veu pot predir millor quan parleu d’un restaurant i no, per exemple, d’un parc que pugui comparteix un nom similar.

Apple va reunir el seu Geo-LM amb dades de l'Oficina del Cens dels Estats Units de 169 àrees, que cobreixen el 80 per cent de la població dels Estats Units. També van construir un Geo-LM global per a totes les regions no incloses en aquestes àrees. Per tant, si un usuari demanés a Siri que trobés una botiga de queviures local que no estava coberta per les dades del cens, utilitzaria el Geo-LM global.

Tot i que això podria omplir algunes mancances a Siri, Apple segueix quedant per darrere de la talla de Google que actualment està formant el seu assistent de veu de propera generació, Duplex, que és capaç de fer trucades de telèfon amb una veu humana hiperrealista. Tot i que és important assenyalar que Google també treballa per millorar la capacitat de l’assistent de Google per entendre diversos accents, dialectes i idiomes.

La publicació del bloc no ha especificat quan es posarà en marxa aquesta actualització. Però esperem que pugueu demanar a Siri que faci una comanda de Denino's Pizza sense que el cridi al seu amic Dino per error.

$config[ads_kvadrat] not found