Napjainkban rohamosan fejlődnek az úgynevezett agyi-számítógépes interfészek, amelyek új lehetőséget kínálhatnak a kommunikációra olyan emberek számára, akik valamilyen betegség vagy trauma következtében elveszítették beszédképességüket. Mint arról a közelmúltban beszámoltunk, a Kaliforniai Egyetem berkeley-i kampuszának kutatói például sikeresen reprodukáltak egy Pink Floyd-dalt a kísérleti alanyaik agyi aktivitását monitorozva szerzet adatokból. Az egyetemhálózat San Franciscó-i kampuszának tudósai pedig most egy újabb szenzációs sikerről számoltak be.
A kutatócsapat egy 47 éves nő, Ann agyának felszínéhez ültetett be egy 253 elektródát tartalmazó implantátumot – írja a The Guardian. Ann 18 évvel ezelőtt szenvedett agytörzsi stroke-ot. Azóta nem tud sem beszélni, sem írni. Helyette egy olyan technológia segítségével kommunikált az elmúlt években, amelyet mozdulataival tud irányítani, és ilyen módon percenként átlagosan 14 szót képes lejegyezni. Immár azonban az implantátum és a mesterséges intelligencia ennél lényegesen gyorsabb és kifejezőbb kommunikáció biztosíthat számára, olyannyira, hogy reményei szerint a jövőben munkába tud majd állni tanácsadóként.
Az implantátum Ann agyának éppen azon régiója felett kapott helyet, amely kritikus fontosságú a beszédhez. Az elektródák azokat az elektromos agyi jeleket érzékelik, amelyek normál esetben a nő nyelvét, állkapcsát, gégéjét és arcát mozgató izmokat irányítanák. A beültetést követően Ann együtt dolgozott a kutatókkal abban, hogy tökéletesítsék az implantátum által továbbított jeleket feldolgozó mesterségesintelligencia-algoritmust. A ChatGPT-hez hasonló nyelvi modellt használó MI a kapott adatokat értelmes mondatokká alakítja, végül egy kijelzőn megjelenített virtuális avatárként hangosan felolvassa azokat. Az avatár ezenkívül néhány alapvető arckifejezést is képes kiolvasni Ann fejéből, mint például a mosolygás, szemöldökráncolás, meglepődés, továbbá az ő hangján szólal meg egy, az esküvőjén készült videófelvételt mintaként felhasználva.
A rendszer egyelőre nem tökéletes. Az Ann által elmondani kívánt szavak több mint negyedét, 28 százalékát hibásan dekódolja. Emellett a sebessége is elmarad a végcéltól, ugyanis percenként 78 szót tud átvinni, míg a természetes beszéd percenként 110-150 szót foglal magában. Mindazonáltal a kutatók szerint a mostani előrelépés azt jelenti, hogy a technológia immár a mindennapokban is hasznos lehet a hasonló problémákkal küzdő betegek számára. Jelenleg azon dolgoznak, hogy az interfész vezeték nélkül is tudjon működni.
Borítóképünk forrása: Noah Berger/University of California, San Francisco (UCSF)