Comprendre el llenguatge natural és el futur de l'AI. Reconeixement de veu

¿Qué es el Procesamiento de Lenguaje Natural y cómo aplicarlo?

Amb l’arribada de l’Alexa de Amazon i de la capacitat consistent de Siri per assumir més tasques (i aconseguir més i més atrevit), molts es pregunten: què passa ara per entendre el llenguatge natural i les interfícies de veu conversacionals?

En aquesta cursa hi ha diverses empreses amb coll i coll. Hi ha Wit.ai, la companyia adquirit per Facebook: podeu jugar amb la demostració. (Proveu aquesta ordre: "Vull veure els gats".) Apple té el seu HomeKit i, amb ella, està fent el que millor Apple fa, donant cops al cul. Amazon també té un frontal amb el seu Echo i Echo Dot, equipat amb Alexa.

MindMeld és una de les empreses que es dedica a la comprensió del llenguatge natural. MindMeld proporciona les seves capacitats de comprensió del llenguatge natural a altres empreses que volen afegir interfícies de veu intel·ligents als seus productes, serveis o dispositius. L'empresa amb seu a San Francisco ofereix als seus associats opcions d'instal·lació i personalització de manera que els seus dispositius tinguin assistents personals ajustats. MindMeld va anunciar recentment aquesta associació amb Spotify, però també està treballant amb empreses d'automoció, agències de defensa, empreses de comerç electrònic i molt més. (I, naturalment, no pot compartir molts detalls d’aquestes associacions).

Invers Va parlar amb Sam Vasisht de MindMeld sobre l'estat del camp del reconeixement de veu, però es va avançar ràpidament a assenyalar que el "reconeixement de veu", com a empresa, és ara un "tema mundà". Actualment, es tracta de "entendre el llenguatge natural. "El reconeixement de veu gairebé ha arribat al seu punt culminant: després de 50 anys de desenvolupament, les IA poden reconèixer efectivament el discurs. Aquests sistemes són gairebé millors que els humans a la feina i, sens dubte, superaran els simples mortals aviat.

El següent pas previsible, llavors, com el desenvolupament d’un nen, és ensenyar-los entendre el llenguatge que ara poden reconèixer. “Aquest és l’home parlant paraules; Aquestes són les paraules "està molt lluny," entenc el que diu aquest ésser humà; Permeteu-me ajudar."

I aquest pas més i el desenvolupament requereix la interpretació significat: Imitant la forma en què la ment humana processa la informació verbal. Hi ha dues parts d’aquesta equació. La primera és la intenció: quin és l’objectiu o el desig de l’home de parlar aquesta frase? Un ordinador que pot extreure una intenció d'una frase parlada pot "entendre" que l’home vol afectar x o interactuar amb y. Interrelacionat amb aquest procés és la segona part de l’equació: Entitat. L'AI. ha de saber determinar l’entitat que s’aborda, l’objecte de la intenció de l’home.

Per fer-ho, MindMeld no ho és (com jo suposava, o esperava) contractar filòsofs. Està emprant experts en llenguatge natural, però gran part de l'AI. El procés d’aprenentatge és en si mateix relativament mans. Si esteu ensenyant el sistema a comprendre les ordres de cafè, heu de mostrar al sistema totes les maneres en què la gent podria demanar cafè.

"M'agradaria una moka".

"Puc tenir una tassa de joe?"

"Només un gran cafè per a mi."

I és aquí on entren els experts en llengua natural (lingüistes). Però fins i tot això ja no és necessari perquè podem recopilar les dades. Aquestes eines us permeten fer milers de persones la mateixa pregunta i compilar les seves respostes. Aleshores, només cal alimentar aquestes respostes a l’I., I voilà: l'AI. pot reaccionar a l’ampli ventall d’informacions possibles. "Des dels milers de consultes, ara només podem aprendre bàsicament com es poden generar milers de milions de consultes", diu Vasisht.

Invers va preguntar a Vasisht, que durant molt de temps va ser un privilegiat a l'AI. i el món de la comprensió del llenguatge natural, per especular per a nosaltres.

MindMeld pot participar en un diàleg estès? Per exemple, si faig una pregunta de seguiment, es farà l'AI. entendre i seguir responent?

Sí. Això és part del disseny. Si algú fa una pregunta incompleta, per exemple, si demano cafè i no especifico la mida del cafè que vull, tornarà i dirà: "Quin cafè trieu voler?"

Esperes algun progrés en la prova de Turing?

Crec que estem molt prop d’ella. Vull dir, va fer IBM Watson El perill!, i crec que va ser un bon exemple. Estem en aquest punt: es posa molt a prop. De la mateixa manera que, ara, pel que fa al reconeixement de la parla, estem en el punt en què les màquines són tan bones com els éssers humans, crec que, sens dubte, en els propers tres o cinc anys, estarem en un punt en què la majoria d’aquesta veu de conversa els sistemes seran considerats tan bons com els humans.

Quin tipus d'automatització de casa fa MindMeld?

Podem aplicar la nostra tecnologia a qualsevol tipus de producte, qualsevol tipus de servei, qualsevol tipus de domini de dades. La domòtica és una d’elles. Dins de la llar, disposes de control d'il·luminació, termòstat, sistemes de seguretat, sistemes d'àudio, sistemes de vídeo, tot aquest tipus de coses. Podem controlar qualsevol dels sistemes sempre que hi hagi la interfície adequada.

Què voleu que pogueu connectar a MindMeld dins de la vostra pròpia casa?

Crec que els casos d’ús més avançats, com ara parlar amb el meu Spotify per dir "Juguin-me la llista de reproducció Rolling Stones", o "Play me music classical this night" (coses que tinc música clàssica aquest vespre), això seria … impressionant.

Alguna cosa més inesperada o fora de la caixa que us agradaria controlar amb la vostra veu?

Les coses que us descriví són les coses que crec que són imminents. En altres paraules, aquestes passaran molt aviat. El que no passarà immediatament, crec, seria coses com microones, màquines de cafè i refrigeradors. Com controlar aquest tipus d’equips, bàsicament puc dir: “La meva màquina de cafè està preparada per fer cafè? Enceneu la màquina de cafè "i si no s’ha preparat, hauria de tornar i dir" Ho sento, però la vostra màquina de cafè no està preparada ": aquest tipus d’intel·ligència encara no existeix. Aquest serà el sant grial: on bàsicament tots els dispositius us poden parlar i dir-vos què pot i no pot fer. Però encara no existeix.

Què creus que retorna la indústria?

Aquests són aparells extremadament econòmics. Vull dir, aquests són aparells que es poden comprar per gairebé res. Fa deu anys, van costar molt més.Per tant, construir noves funcions és una cosa que afegeix els costos d'aquests dispositius. Finalment, la proposta de valor actual és molt forta; la majoria d’aquests fabricants no estan disposats a afegir noves funcions, tret que estiguin en un punt de cost molt baix.

Crec que és un aspecte d’aquest. L’altre aspecte és que estem parlant d’haver connectat aquests dispositius. Per tant, ha d’haver alguna cosa més que un cas d’ús de veu per connectar aquests dispositius. Hi ha d’haver més capacitats que necessitin per a aquesta connexió abans que siguin viables.

Coneixes alguna empresa que treballi en aquesta última capacitat?

Moltes empreses de semiconductors estan treballant en matrius de micròfons de molt baix cost. El tipus de cosa que bàsicament podeu incrustar - a un cost molt baix, en pràcticament qualsevol dispositiu o aplicació - que permeti que hi hagi una entrada de veu. I no necessiteu estar al costat d’aquests dispositius: podeu parlar a uns 10 metres de distància. Construir aquesta capacitat - crec que és el punt de partida. I crec que permetrà a la gent començar a posar micròfons als dispositius i, a continuació, seguiran les funcions avançades de l’altre. Però ara com ara, no conec cap empresa que construeixi aquest tipus de màquina de cafè intel·ligent o microones intel·ligents o rentadora.

Quina és la vostra millor estimació per a quan tinguem habitatges totalment intel·ligents, apartaments totalment elegants?

Avui en dia, en realitat gairebé tenim tots els subsistemes essencials de la casa que la gent vol automatitzar, que són capaços de ser automatitzats. Això inclou llums, termòstats, sistemes de seguretat, portes de garatge, panys de la porta davantera - coses així. Totes aquestes coses es poden fer. El problema és que es tracta de punts de preus. Aquests encara es troben en el punt de preus on són principalment els primers i els que tenen una necessitat real. Però els punts de preus d’aquestes coses cauen dràsticament, molt ràpidament. Crec que probablement aconseguirem aquests subsistemes al mercat massiu en els propers anys.

Les altres coses de les quals vaig parlar: automatitzar els aparells de baix cost, crec que probablement siga en el termini de cinc a set anys com a mínim. Més que 10 anys, abans que es converteixin en realitat. Però, com he dit abans, aquestes són coses que requeriran moltes altres coses que s’uneixen. I podria passar més aviat si aquests diversos ingredients es connectin més aviat.

Què us sembla que semblaria un apartament a la ciutat de Nova York o a San Francisco, per exemple, el 2050?

2050! Wow. Crec que estarem plenament allà. El tipus de coses que veiem a les pel·lícules de ciència-ficció, on podeu parlar més aviat de tots els sistemes de la vostra casa i controlar-ho tot amb veu. Crec que aquest tipus de capacitats estaran generalitzades. Certament a ciutats com Nova York i San Francisco.

Hem provat el reconeixement de veu sobre fotos de Facebook amb imatges gràfiques

Avui, Facebook va publicar una funció anomenada text alt automàtic que fa que la qualitat de les xarxes socials sigui molt accessible a les persones cecs o amb discapacitat visual. Mitjançant la funció VoiceOver d’IOS, la tecnologia de reconeixement d’objectes de Facebook llista elements que pot contenir una imatge en qüestió. Concretament, aquells ...

Quin és el futur de l'aplicació de la llei? Un Startup de Rússia anomenat NTechLab pensa que és una eina de reconeixement facial.

NTechLab, una empresa que va guanyar a Google en una competència de programari de reconeixement facial, espera que les forces de l'ordre es dirigeixin a ell per millorar els mètodes de vigilància.

20 Assenyala que veu un futur amb tu o que veu un sense tu

La vostra relació va bé, però us pregunteu cap a on va? Aquests són tots els signes que veu un futur amb vosaltres.

$config[ads_kvadrat] not found