Mintegy 200 nyelv közötti fordításra alkalmas Mesterséges Intelligenciát (MI) alkotott a Facebook-tulajdonos Meta. A fordítótechnológia fejlődése már jó ideje az MI-re alapul, a neurális gépi fordítás elég jó eredményekre képes bizonyos nyelvek között. A fő problémát azonban az jelenti, hogy míg a leggyakrabban használt nyelvek között a fordítás már akár az ingyenesen elérhető Google fordítóval is többé-kevésbé pontos, és nyelvileg is helyes eredmények születnek, a kevésbé gyakori – vagy inkább az internetes szövegek mennyiségét tekintve ritkább – nyelvek közötti fordítások már kevésbé sikerülnek jól. Sok esetben két ilyen nyelv közötti fordítás úgy születik meg, hogy az MI a kiindulási nyelvből először angolra fordít.
Ennek a problémának a megoldására hozta létre a Meta az NLLB-200 nevű fordítóprogramját, amely a természetes nyelvi feldolgozás (NLP) módszerével igyekszik minél több nyelv között megteremteni az átjárást. Az NLLB a No Language Left Behind (egy nyelvet sem hagyunk hátra) rövidítése, míg a 200 az MI által ismert nyelvek számát jelenti. Természetesen ez még mindig messze van az emberek által beszélt több mint 7000 nyelvtől, ám számos olyan ember előtt nyithatja meg a gépi fordítás lehetőségét, akik eddig ezt kénytelenek voltak nélkülözni, vagy csupán alacsony minőségben érhették el.
A Meta MI-je új eszközt is kapott a neurális gépi fordítás fejlesztésére, amely képes a neten megtalálni a párhuzamos szövegeket, ez a LASER3. A modell tanítását nyelvspecifikus kódolók is segítik, és lehetővé teszik, hogy nagyméretű minták szülessenek azonos mondatokból. Szemben a széles körben használt gépi fordítókkal, melyek kevesebb mint 25 afrikai nyelvet támogatnak, az NLLB-200 55 afrikai nyelvet ismer. Az új neurális gépi fordító 44 százalékos javulást ért el a korábbi legkorszerűbb programokkal szemben. Az afrikai és indiai nyelvek közötti eredmények terén a javulás mértéke még ennél is jobb, 70 százalékos.
Bár a legpontosabb megoldások hagyományosan a nyelvi párok külön-külön történő fejlesztésével jönnek létre, ezek skálázhatósága limitált. Ezt jól érzékelteti, hogy a cég korábban használt, száz nyelven működő fordítója tízezer nyelvi párral, míg a mostani 200 nyelv már 40 ezerrel működik. Ezért a cég többnyelvű megközelítést alkalmaz.
Az NLLB-200 többek között a cég saját oldalain, így a Facebookon és az Instagramon segíti a fordításokat, de a Wikipediával is együttműködik. A cég a modell forráskódját is nyilvánossá tette, de a Meta mesterséges intelligenciával foglalkozó részlege 200 ezer dollárig terjedő adományt is nyújt azon civil szervezetek számára, amelyek a való életben történő használatra hoznak létre alkalmazásokat. Zuckerberg cége szerint idővel elkövetkezhet a különböző nyelveken a valós idejű fordítás is, a program képes lehet például automatikus feliratokat generálni a bollywoodi filmekhez, és a későbbiekben a metaverzum elérését is segítheti, kiszélesítve a felhasználók körét a szabadabb kommunikációval.
A gépi fordítás azonban továbbra is rendkívül nehéz feladat, ezen a területen akár kisebb magyar cégeknek is maradhat hely a továbbiakban is. Az MI fejlődése ugyan egyeseket néha szinte hihetetlen megállapításokra sarkall, ám bőven van még hova fejlődni, és a szektor szabályozása is számos változást hozhat.
Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.