Az OpenAI által a napokban bejelentett új generatív modellcsaládja, az OpenAI O1 a legtöbb benchmarkban már eléri egy jó PhD-tanuló szintjét. (A tesztelések során általában a következő paramétereket mérik: érvelési képességek, kódolási feladatok, matematikai feladatok 7 nehézségi szinttel, eszközök/függvények megoldási képessége, multitasking.)
A legtöbb AI-elemző az első tesztek alapján el van ámulva az O1 képességeitől. Ráadásul az O1-nak sikerült 120 pontot elérnie az IQ-teszteken is, miközben a ChatGPT-4 kicsit korábban még csak 85 pontot tudott összeszedni. (Tízből kilenc embernek kisebb az IQ-szintje mint 120 pont.)
Öt évvel ezelőtt a GPT-2 még a válaszai átlagában egy óvodás tudásszintjén állt. A GPT-3 már elérte egy általános iskolás tudásszintjét. A GPT-4 már átlagban egy főiskolai tanuló képességeivel rendelkezett és ez volt az első generatív AI, amely át tudott menni a híres Turing-teszten. És most 2024 szeptemberében az O1 elérte egy PhD-tanuló tudásszintjét.
Amikor a ma már 76 éves Raymond Kurzweil feltaláló és jövőkutató egy 1999-es könyvében (The Age of Spiritual Machines – A spirituális gépek korszaka) azt prognosztizálta, hogy a számítógépek 2029-ra okosabbak lesznek mint az emberek, a legtöbb tudós a jóslatát teljesen komolytalannak tartotta. Kurzweil elképzelését a számítási teljesítmények egyre gyorsuló fejlődésére alapozta: az elmúlt évtizedekben mind a csipek sebessége, mint a költséghatékonysága exponenciálisan nő. Kurzweil elmélete szerint amint egy technológia megközelíti a lehetőségeinek határait, úgy egy új technológia jelenik meg, ami lehetővé teszi a folyamatosan gyorsuló fejlődés fenntartását.
Ma már a legtöbb tech-nagyágyú – Elon Musktól kezdve Mark Zuckerbergig, Jensen Huangtól Sam Altmanig – valamikor 2025 és 2028 közé teszi az Általános Mesterséges Intelligencia (AGI) elérését.
Az optimizmus hátterében az áll, hogy az elmúlt három évben egyre gyorsuló verseny alakult ki az úgynevezett nagy nyelvi modellek (Large Language Model – LLM) piacán.
Miközben olyan, még pár évvel ezelőtt sztárolt, korábban nagy költségeken fejlesztett virtuális asszisztens technológiák kerülnek lassan a süllyesztőbe, mint az Amazon Alexa, a nagy nyelvi modelleknek szinte havonta jönnek ki újabb és újabb, egyre jobb verziói.
Vannak persze még megoldásra váró problémák a generatív AI területén: például a mesterséges intelligencia szerverparkjai irdatlan mértékű energiát igényelnek, vagy például nemsokára „elfogy” az az adatmennyiség, amivel tovább lehetne képezni a mesterséges intelligencia rendszereket.
De mára már az iparágban az új megoldások is körvonalazódnak. Például az újabb LLM-rendszereket már szintetikus adatokkal, vagyis a valóságban nem létező, a számítógép által csak gyakorlásnak létrehozott adatokkal tanítjuk. Az LLM-rendszereknél a jövőben eleve nem az egyre nagyobb adatmennyiségre kell majd koncentrálni, hanem hogy az AI a válaszait minél jobban megfontolja és több oldalról is ellenőrizze. Az energiaigény biztosítására pedig érdekes hír, hogy Pennsylvaniában újranyitnak 2028-ra egy atomerőművet, hogy az 20 évig árammal lássa el a Microsoft AI-üzletágát.
Bár az OpenAI egyértelműen ágazati piacvezető és a legtöbb hír az OpenAI fejlesztéséről szól, de a többi LLM-rendszer is nagyon rövid idő alatt elképesztő fejlődést ért el.
Az Anthropic nevű vállalatot 2021-ben hét OpenAI-ból kivált kolléga alapította. 2024 májusára már 500 fő dolgozott a cégben és Claude nevű chatbotjuknak havi 65 millió felhasználója volt. Az Anthropic Claude1 2023 márciusában indult, 2023 júliusában megjelent a Claude2, majd 2024 márciusában a Claude3, és 2024 júniusában a jelenlegi legutolsó, Claude 3.5-as verzió. A Claude 3.5 már egészen elképesztő dolgokra képes. A benchmark teszteken is az első helyen állt az elmúlt hónapokban egészen az OpenAI 01 megjelenéséig.
Az Elon Musk által 2023 márciusában alapított xAI 2024 márciusában dobta piacra a Grok-1 nevű chatbotját, 2024 augusztusában bejelentették a Grok-2 indulását és Musk 2024. év végére ígéri a Grok-3 piacra dobását.
A Google (Alphabet) is gőzerővel építi a saját nagy nyelvi modelljét, a Geminit. (A Gemini 1.5 Pro után nemsokára jön a Gemini 2.) A Meta pedig a saját Llama nevű modelljét fejleszti. (A Llama 2023 februárjában indult, 2024. júliusban adták ki a legutolsó, Llama 3.1-es verziót.)
Megfigyelhető, hogy mindegyik globális technológiai vállalat kulcsfontosságúnak tartja a jövője szempontjából egy saját nagy nyelvi modell felépítését vagy, hogy legalább közvetlen befektetések útján biztosítsa a helyét az LLM-szektorban.
Így a kisebb LLM cégek mögött is jórészt nagyok állnak: Az OpenAI mögött lényegében a Microsoft áll. A Microsoft eddig már 13 milliárd dollárt fektetett be az OpenAI-ba és a cég exkluzív felhőszolgáltatója is. 2028-ra együtt építenek fel majd egy elképesztő méretű és több mint 100 milliárd dollárba kerülő adatközpontot Csillagkapu néven és egy szuperszámítógépet, amelynek a feladata a mesterséges intelligencia futtatása lesz. A Microsoft a megjelent sajtóhírek ellenére nem 49 százalékos tulajdonosa az OpenAI-nak, csak egy bizalmi megállapodás szerint a jövőbeli vállalati nyereségből részesedik majd 49 százalékban.
Az Anthropicba is az Amazon eddig 4 milliárd dollárt, az Alphabet 2 milliárd dollárt fektetett be.
Ha a nyugati világot nézzük, az LLM-ágazat meghatározó cégei közül szinte az összes cég amerikai. Bár a szintén jó benchmarkokkal rendelkező párizsi székhelyű Mistral AI francia cégnek számít, de volt Google- és Meta-fejlesztők – akik francia származásúak – alapították és folyamatosan amerikai kockázati tőkét kapott a saját LLM rendszerének fejlesztésére.
A bencmark teszteken viszont mindig csak a nyugati világ nagy LLM-rendszereit hasonlítják össze. A technológiai hírek is csak a nyugati LLM-rendszerekről szólnak.
De közben a világ többi része sem alszik.
Eric Schmidt, a Google 2001 és 2011 közötti CEO-ja szerint a kínai generatív AI-rendszerek mintegy 6-12 hónappal vannak elmaradva az amerikaiak mögött, de a kínaiak keményen dolgoznak a lemaradás csökkentésén.
Az Alibaba 2024 júniusában jött ki a Qwen2 LLM rendszerrel. (A Qwen 2.5 72B körülbelül a ChatGPT-4O és a Claude 3.5 szintjén áll.) A Huawei 2024 júniusában jött ki a Pangu 5.0 verziójával, a Baidu (a Google kínai megfelelője) 2023 óta pedig folyamatosan az Ernie chatbotot fejleszti.
Az Abu-Dhabiban működő Technológiai Innovációs Intézet által létrehozott Falcon nevű chatbot, az első arab nyelvű adatokon kiképzett LLM-rendszer nem is rossz benchmark mutatókkal.
Oroszországban nagy népszerűségnek örvend a Sberbank Gigachat nevű LLM-rendszere, amelyet a bank 2023 áprilisában dobott először a piacra. Felhasználóinak a száma 2024 második negyedévre elérte a 6 millió főt. A rendszer képes videókat, képeket generálni, a programozásban segíteni, illetve bármilyen témáról társalogni. Az orosz felhasználók körében szintén népszerű a Yandex LLM-rendszere. Yandex GPT1 2023 májusában debütált. A Yandex GPT2 2023 szeptemberében indult és 2023 októberében 55 pontra rakta le – a sikeres teszthez 40 pont kell – irodalom tantárgyból az orosz érettségit. 2024 márciusában a cég piacra dobta a Yandex GPT3 verzióját, amely a tesztek alapján 69 százalékkal jobban teljesít, mint a GPT2.
Kevesebb figyelem irányul rá, de a generatív AI mellett nagy robbanás előtt áll a humanoid robotok iparága is.
Az emberiség évtizedekig vágyott humanoid robotok fejlesztésére, de a technikai körülmények eddig nem voltak megfelelőek. De itt is több minden történt az elmúlt 3 évben, mint az azt megelőző 30 évben. Jelenleg több tucat amerikai és ázsiai cég fejleszt humanoid robotokat.
Nézzünk a fejlődésre néhány példát:
Elon Musk 2022-ben jelentette be, hogy a Tesla a járműgyártás mellett egy humanoid robot üzletágat is létrehoz, és szerinte ez az üzletág nemsokára több bevételt fog termelni, mint az elektromos autógyártás. A 2022 szeptemberében bemutatott humanoid robot prototípus (Tesla Bumblebee) még járni is alig tudott és a szakértők akkor még szinte kinevették Musk amatőrnek és félresikerültnek nevezett próbálkozását. A cég viszont 15 hónap alatt eljutott a kezdő prototípustól a Tesla Optimus első, majd második generációjáig. (Érdemes megnézni az Optimus-2 videóját.)
Az Optimus-2 gyári tesztelése már zajlik a Teslánál, miközben az újabb jelentős előrelépést jelentő 3. generáció megjelenésére a hírek szerint már csak 3-6 hónapot kell várni. A tervek szerint 2025-ben mintegy 1000 legyártott darabbal tovább folytatódik majd az Optimus tesztelése a Tesla gyáraiban, és 2026-ban megkezdődhet nagyobb mennyiségben a robotok kiszállítása külső – elsősorban ipari termelő – cégeknek. A Tesla humanoid robotjait a xAI Grok LLM rendszere fogja vezérelni.
Még érdekesebb egy kaliforniai startup a Figure AI-sikersztorija. A startupoknak különösen nehéz a helyzete a humanoid robotok iparágában. Az ágazat gyakorlatilag még nem is létezik. Nincsenek beszállítói láncok, nincsenek kialakult gyártási folyamatok, nincsenek bevált versenytársi minták.
A Figure AI 12 hónap fejlesztési munka után 2023 szeptemberében jelentette be a Figure 01 humanoid robotjának indulását, majd a robotot a BMW gyárában is elkezdték tesztelni. 2024 augusztusában bemutatták a Figure 02 robotot, amely egy jelentős technológiai ugrást jelent a Figure 01-hez képest: 3x nagyobb számítási kapacitás, nagyobb akkumulátor, nincs szabadon lévő vezeték, jobb teljesítményű szenzorok és RGB-kamerák, biztosabb járás, sokkal kifinomultabb robotkezek. (Érdemes megnézni a Figure 02 videóját.) A Figure robotokon az OpenAI LLM rendszere fut majd. A Figure AI alapító-vezérigazgatója, Brett Adcock szerint a Figure 03 fejlesztése is már gőzerővel zajlik, és szerinte a Figure robotok 3 év múlva már kereskedelmi és háztartási felhasználásra kerülhetnek.
A Figure AI-nak a 2022-es indulása óta 850 millió dollár kockázati tőkét sikerült összekalapoznia.
Persze a kínaiak sincsenek túlságosan elmaradva az amerikaiaktól.
Az Unitree Robotics által kifejlesztett humanoid robot, az Unitree G1 például teljesen elképesztő mutatványokra képes. Ráadásul ez a robot már a gyártás előtti fázisban van és a kínaiak az árát is megnevezték (16 ezer dollár). Az ágazatban a fejlődés annyira dinamikus, hogy a megfigyelők is néha arról vitatkoznak, hogy a humanoid robotruha alatt biztosan ember van, annyira tökéletes kezd ma már lenni egy-egy robot mozgáskoordinációja. (Persze gyorsan kiderül, hogy ez nem igaz.) A generatív AI-val felvértezett humanoid robotok ideje tehát pár év múlva valóban eljön.
A fentiek alapján az alábbi következtetéseket vonhatjuk le:
Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.