La interfície cervell-ordinador pot traduir els pensaments al discurs

$config[ads_kvadrat] not found

Первый взгляд на пользовательский интерфейс PS5

Первый взгляд на пользовательский интерфейс PS5

Taula de continguts:

Anonim

Els neuroenginyers han creat un nou sistema que pot traduir els pensaments simples en discursos recognoscibles, utilitzant intel·ligència artificial i un sintetitzador de veu, segons un estudi publicat el dimarts.

Un equip d’investigadors amb seu a Nova York va ser capaç de reconstruir paraules utilitzant només l’activitat cerebral, una innovació que podia preparar el camí per a tecnologies controlades pel cervell com, per exemple, un telèfon intel·ligent que pugui traduir els vostres pensaments en missatges de text.

La doctora Nima Mesgarani, professora associada a la Universitat de Columbia, va dirigir l'estudi i li va dir Invers que veu un gran potencial per ajudar a restablir el discurs a les persones que es recuperen d’un ictus o que viuen amb esclerosi lateral amiotròfica (ELA). Més endavant, aquest tipus de tecnologia també podria obrir portes als telèfons intel·ligents connectats al cervell que podrien permetre als usuaris fer servir el text fent servir les seves ments, tot i que encara hi ha un camí llunyà. El seu treball es va publicar a la revista Informes científics.

"Una de les motivacions d'aquest treball … és per a mètodes alternatius d'interacció home-ordinador, com una possible interfície entre un usuari i un telèfon intel·ligent", diu. "No obstant això, això encara està lluny de la realitat i, de moment, la informació que es pot extreure amb mètodes no invasius no és suficient per a una aplicació d'interfície cervell-ordinador de parla".

Escolteu el discurs generat per la interfície cervell-ordinador.

Per desenvolupar la nova tècnica, Mesgarani i el seu col·lega, el Dr. Ashesh Dinesh Mehta, de l'Institut de Neurociències de Northwell Health Physician Partners, van començar a examinar l'activitat cerebral dels pacients amb epilèpsia per al seu estudi. Aquests pacients ja tenien implants d’elèctrodes en el cervell per controlar les convulsions, que Mesgarani i Mehta van poder utilitzar per recopilar dades per a la seva investigació.

El duo va demanar als participants disposats a escoltar els altaveus que reciten els números entre zero i nou, i després van gravar els senyals cerebrals des d'aquesta interacció. A continuació, van formar una xarxa neuronal - un programa que imita l'estructura neuronal del cervell humà - per reconèixer patrons en els senyals i traduir-los en paraules de so robòtic utilitzant un sintetitzador de veu, conegut com a vocoder.

El resultat va ser un clip de veu curt del que sembla Microsoft Sam que compta de zero a nou. La part impressionant és el grau de claredat de la parla amb altres mètodes que els investigadors van provar. Encara hi ha molta feina per fer.

"Pot trigar una dècada abans que aquesta tecnologia estigui disponible", diu Mesgarani. "Necessitem més progrés tant en elèctrodes implantables a llarg termini com bio-compatibles i / o en tecnologies d'avanç en mètodes d'enregistrament neuronal no invasiu. També necessitem una millor comprensió de com el cervell representa el discurs, de manera que puguem afinar els nostres mètodes de descodificació."

Els pacients que van formar part d’aquest estudi, per exemple, tenien una cirurgia cerebral per controlar la implantació d’electrocorticografia. Aquest és un procés extremadament invasiu que requereix cirurgia cerebral oberta, cosa que la majoria de la gent pot no estar disposada a sotmetre's, fins i tot si hi havia la possibilitat de restaurar algunes de les seves capacitats de parla.

Per ara, aquest estudi va introduir un mètode per descodificar senyals cerebrals en la parla. Si descobrim com detectar amb precisió l’activitat cerebral sense cirurgia, ens acostarem més a revolucionar la teràpia de la parla, però potencialment a aconseguir telèfons intel·ligents connectats al cervell.

La investigació de la interfície cervell-ordinador ha estat rebent interessos nous en els darrers anys. A l'abril de 2017, Facebook va anunciar que estava treballant en un BCI durant la seva conferència anual F8. I Elon Musk va anunciar al novembre de 2018 que Neuralink, la seva pròpia startup BCI, estava contractant.

Resum

La reconstrucció d’estimulació auditiva és una tècnica que troba la millor aproximació de l’estímul acústic de la població d’activitat neural evocada. La reconstrucció de la parla des de l'escorça auditiva humana crea la possibilitat que un discurs neuroprosthetic estableixi una comunicació directa amb el cervell i s'hagi demostrat que és possible en condicions obertes i secretes. No obstant això, la baixa qualitat del disc reconstruït ha limitat molt la utilitat d’aquest mètode per a aplicacions d’interfície cervell-ordinador (BCI). Per avançar en l'estat de la tècnica en la neuropròtesi de la parla, vam combinar els recents avenços en l'aprenentatge profund amb les últimes innovacions en tecnologies de síntesi de veu per reconstruir el discurs intel·ligible tancat del còrtex auditiu humà. Hem investigat la dependència de la precisió de la reconstrucció en els mètodes de regressió lineal i no lineal (xarxa neuronal profunda) i la representació acústica que s’utilitza com a objectiu de reconstrucció, incloent-hi els paràmetres d’espectrograma auditiu i de síntesi de veu. A més, es va comparar la precisió de reconstrucció de rangs de freqüència neuronal baixa i alta. Els nostres resultats mostren que un model de xarxa neuronal profunda que estima directament els paràmetres d’un sintetitzador de veu de totes les freqüències neuronals aconsegueix les puntuacions subjectives i objectives més altes en una tasca de reconeixement de dígits, millorant la intel·ligibilitat en un 65% sobre el mètode de referència que va utilitzar la regressió lineal a reconstruir l’espectrograma auditiu. Aquests resultats demostren l'eficàcia dels algorismes d'aprenentatge profund i de síntesi de la parla per dissenyar la propera generació de sistemes BCI de veu, que no només poden restaurar les comunicacions per als pacients paralitzats, sinó que també poden transformar les tecnologies d'interacció humà-ordinador.

Vídeo relacionat: Els robots de detecció d’ona cerebral poden servir com a extensions del cos humà

$config[ads_kvadrat] not found