Elképesztő és egyben félelmetes technológiákat mutatott be a Google a szoftverfejlesztőknek tartott rendezvényén, a Google I/O-n. A kulcskifejezés ezúttal a multimodális algoritmus volt, ami azt jelenti, hogy egy mesterségesintelligencia-algoritmus képes megérteni és összevetni a különbözőképpen szerzett információkat, így a szövegeket, a kódokat, a hangokat, a képeket és a videókat, ezekből pedig következtetések levonására is képes. Az egyik kedden bemutatott funkció pedig megtalálja az elveszett tárgyakat: csak fel kell tenni a készüléknek a kérdést, hogy „hol van a kulcsom”, és az megválaszolja.
Új lendületet kap a Gemini Nano, a Pixel telefonokra telepített nagy nyelvi modell. A nevét is megváltoztatják, ami a Gemini Nano with Multimodality lesz. Sundar Pichai vezérigazgató a szoftver képességeit azzal szemléltette a szoftvermérnököknek tartott rendezvényen, hogy az lehetővé teszi, hogy „bármilyen bemenetet bármilyen kimenetté alakítson”.
Ez azt jelenti, hogy képes információt nyerni szövegből, fotókból, hangból, internetre feltöltött videókból, illetve a telefon kamerájáról készült élő videókból, majd értelmezni azokat, összefoglalni a megszerzett információkat, végül pedig megválaszolni az azokkal kapcsolatos kérdéseket. Erre mutattak is egy példát egy videóban, amiben valaki a telefonja kamerájával könyveket olvasott be egy polcon, majd a címeket adatbázisban rögzítette – magyarázta a Wired.
A Nano ezentúl riaszthat, ha be akarnak csapni minket.
A csalásriasztó funkció prototípusa képes meghallgatni és értelmezni a telefonbeszélgetést, és ha csalást gyanít, akkor azt jelzi.
A technológiai óriás bemutatta az Astra projektet is, ami a jövő mesterségesintelligencia-asszisztense lehet. A program a képességeit bemutató videóban a rendszer megválaszolt szóban elhangzott, arra vonatkozó kérdéseket, hogy mit lát a telefon kamerájával. Sőt a szoftver azt is megválaszolta a kérdezőnek, hogy hol hagyta a szemüvegét.
A Google a Workspace irodai eszközcsomagjába is beépíti a mesterséges intelligenciát. Keddtől számos alkalmazás, köztük a Gmail, a Google Drive, a Dokumentumok, a Táblázatok és a Diák oldalsó paneljén megjelenik egy gomb, amellyel a Google Gemini 1.5 Pro verzióját be lehet kapcsolni egy friss blogbejegyzés szerint. Ezáltal többek közt a Gmail is olyan újítást kap, amely például képes az összes, egy adott témával kapcsolatos e-mail összefoglalására.
A Gemini nemcsak az irodai dolgozóknak könnyítheti meg az életét, hanem a tanulókét és a szüleikét is.
Például a chatbot segíthet a házi feladat elkészítésében vagy összefoglalót adhat a szülői értekezletekről. A Google Circle to Search pedig hamarosan arra is használható lesz, hogy részletesen megmutassa a diákoknak matematikai feladatok megoldását.
A Google Search képességein is fejlesztettek. Egy bemutatóvideón keresztül mutattak a mesterséges intelligenciának egy elromlott lemezjátszót, majd megkérdezték tőle, hogy mi lehet vele a gond. Az algoritmus azonnal sorolta a lehetséges problémákat és megoldási javaslatokat is adott. A szoftver még a találatok felsorolása előtt megválaszolta a keresési kérdést. Ezt a funkciót jelenleg az Egyesült Királyságban tesztelik, de hamarosan máshol is elérhető lesz.
A Google Fotók is új funkciót kap a nyáron. A jövőben az applikáció összeköttetésben lehet a Gemini mesterséges intelligenciával, ha a felhasználó szeretné. Az algoritmus kereshet a fényképek közt és az eddigieknél részletesebb eredményeket adhat. Például megmondhatjuk neki, hogy keresse ki az összes olyan képet, amint egy bizonyos rendszám szerepel – magyarázta Jeremy Selier szoftvermérnök keddi blogbejegyzésében.
Nemsokára pedig egyes zenészek, művészek és filmesek olyan mesterséges intelligenciát tesztelhetnek, amely képet, videót és zenét alkot.
A Google azt ígéri, hogy a távolabbi jövőben egy virtuális csapattársat is a felhasználók rendelkezésére bocsát. Ennek megmondhatjuk, hogy végezzen el bizonyos feladatokat, például vegyen részt egyszerre több online megbeszélésen – számolt be a BBC.
A Google egy nappal az OpenAI hétfői rendezvénye után mutatta be újításait. A versenytárs OpenAI a GPT-4o-t leplezte le. Ez a program képes emberi arckifejezéseket leolvasni a telefon kameráján keresztül, beszélgetni, sőt, flörtölni is.
Alig egy nappal a nagy bemutató után kulcsember távozik az OpenAI-tólIlya Sutskever volt az OpenAI agya a beszámolók szerint, míg a cégvezető Sam Altman inkább a tőke felhajtásában és az evangelizációban játszott fontos szerepet. |
Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.