BÉT logóÁrfolyamok: 15 perccel késleltetett adatok

Digitális szájról olvasás

Miközben egyre több feladatot bíznak emberek helyett gépekre, az automaták ügyfelekkel való kommunikációja még jócskán hagy kívánnivalót maga után. Ahhoz, hogy ezt a területet is meghódíthassák a gépek - teljesen átvéve olyan monoton munkákat, mint a jegyeladás vagy a menetrendi tájékoztatás - még komoly fejlődésre van szükség. A kutatók ma már a hang- és mozdulatfelismerés kombinálásán dolgoznak.

A közvetlenül emberek kiszolgálására tervezett gépek hőskorában még gombokkal vezérelhettük az automatákat, csakhogy komplex feladatoknál egyszerű piktogramokkal már nem lehetett leírni a funkciókat. A helyi nyelven készült feliratokat és magyarázatokat a külföldiek nem feltétlenül értik, ráadásul a kifüggesztett tájékoztatók könnyen meg is sérülhetnek.

Ezeket a problémákat a fejlesztők érintőképernyők és változó funkciójú gombok alkalmazásával igyekeztek kiküszöbölni. Itt már a magyarázó feliratok könnyen cserélhetők, így sokrétű menük is összeállíthatók, ráadásul jóval egyszerűbb a különféle nyelvek alkalmazása is.

Vannak azonban területek, ahol a műveletek összetettek ugyan, ám ezek a rendszerek mégsem alkalmazhatók, vagy nem kellően gyorsak. Egy gépkocsi különféle kezelőszerveinél például nem lehet menükkel lekötni a vezető figyelmét, noha a vezérlési feladatok egyre összetettebbek lesznek, a sokféle vasúti kedvezmény idegen nyelvű elmagyarázása pedig aligha gyorsítja a jegyváltást.

Emiatt a szakértők a hangfelismerő rendszerek integrálását tartják a jövő megoldásának. Ezek a rendszerek ugyan akár 99 százalékos felismerési pontosságra is képesek manapság, ám teljesítményük drasztikusan romlik, ha némileg eltérünk az ideális körülményektől.

Márpedig a valós élet közel sem kínál optimális működési feltételeket: az emberek nemcsak távol vannak a mikrofonoktól, de gyakran mormognak vagy valamilyen dialektusban beszélnek, nem csupán néhány száz szót használnak, ráadásul az állomásokon, autóban vagy áruházakban sokszor igen nagy a zaj is. Ilyen körülmények közt két ember egymás gesztusaiból, szájmozgásából következtet a mondanivaló lényegére, ám a gépek erre ma még képtelenek.

Német kutatók azonban már kísérleteznek a szájról olvasás digitalizálásával. Ez a módszer ugyan közel sem képes olyan hatékonyságra, mint a hangfelismerés, a két rendszer kombinálása azonban komoly teljesítménynövekedést hozhat - írja a Financial Times Deutschland.

Az egyik tesztelés alatt lévő rendszer az alsó és felső ajak mellett a szájsarkak, az orr és az áll mozgását is figyeli. Ezek jellegzetes elmozdulásából elég jól lehet bizonyos szavak kimondására következtetni.

Egy másik eljárás a különféle gesztusok felismerését integrálná a hang alapú megoldásokhoz. A fejlesztők elképzelése szerint elegendő volna rámutatni a bekapcsolni kívánt berendezésre, illetve fejmozgással aktiválni lehetne bizonyos funkciókat.

A még merészebb elképzelések szerint a jövőben még a fejünket sem kellene megmozdítanunk a különféle készülékek kezeléséhez. Egy gépjárművekben hasznosítandó módszer kamerákkal figyeli a szemet: ha ránézünk valamire, a szemfehérjén a szembogár elmozdul, ezt könnyen észleli a rendszer. Így például az autórádiónak akár tekintetünkkel is adhatunk majd utasításokat. (VG)

Címoldalról ajánljuk

Tovább a címoldalra

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.