Nagy nyelvi modellek az orvosok ellen – hihetetlen eredmény született

Egy amerikai vizsgálatban azokat a kérdéseket tették fel a chatbotoknak, amelyeket a rezidenseknek is meg kell válaszolniuk, mielőtt az engedélyüket megkapják. A vizsgázóknak a kérdések 60 százalékára kell helyesen válaszolniuk, a történelmi átlag 75 százalékos eredmény. A nagy nyelvi modellek klinikai érvelésre is képesek, egészen kiváló eredménnyel.

Lengyel Gabriella

2024.07.23, 20:40

Frissítve: 2024.07.24, 13:52

Mit tippel, ki diagnosztizál jobban, az orvosjelöltek vagy chatbot? A mesterséges intelligencia sokkolóan gyors fejlődéséről szinte naponta jelennek meg hírek. Egy friss kutatás arra irányult, miként teljesít orvosi kérdések megválaszolásában

a ChatGPT,
a Claude,
a Google Gemini,
a Grok és
a Llama.

Azt szerették volna megtudni, hogy miként válaszolják meg az orvosi kérdéseket, milyen tájékoztatást adnak a kezelési lehetőségekről. A kísérlet azt firtatta, vannak-e jelentős különbségek a vezető platformok között a klinikai alkalmasságuk tekintetében.

Nagy nyelvi modellek vs. orvos?

Azokat a kérdéseket tették fel a chatbotoknak, amelyeket a rezidenseknek is meg kell válaszolniuk, mielőtt az engedélyüket megkapják. A vizsgázóknak a kérdések 60 százalékára kell helyesen válaszolniuk, a történelmi átlag 75 százalékos eredmény – írja cikkében a CNBC. A kérdéssort az amerikai gyakorlatban az első év végén kell kitölteniük a rezidenseknek, és azt méri, hogy mennyire tudják alkalmazni a klinikai tudományokkal kapcsolatos ismereteiket a felügyelet nélküli orvosi gyakorlatban. Emellett tesztelték azt a képességüket is, hogy a különböző tudományágak között hogyan képesek a betegeket navigálni, ellátni.

Nem egyformán teljesítettek a chatbotok

A teszt ellenőrzésekor a következő sorrend alakult ki:

ChatGPT-4o (OpenAI) – 49/50 kérdés helyes (98 százalék)
Claude 3.5 (Anthropic) – 45/50 (90 százalék)
Gemini Advanced (Google) – 43/50 (86 százalék)
Grok (xAI) – 42/50 (84 százalék)
HuggingChat (Llama) – 33/50 (66 százalék)

A kísérletben tehát az OpenAI ChatGPT-4o szerepelt a legjobban, amely 98 százalékot ért el. Részletes orvosi elemzéseket nyújtott, az orvosi nyelvezetet használta. Nemcsak széles körű érveléssel adott válaszokat, hanem kontextusba helyezte a döntéshozatali folyamatát, sőt azt is megmagyarázta, hogy az alternatív válaszok miért kevésbé megfelelők.

Második helyen az Anthropic fejlesztése, a Claude végzett 90 százalékos eredménnyel. Emberszerűbb válaszokat adott egyszerűbb nyelvezettel, és úgy építette fel a magyarázatot, hogy az a betegek számára érhetőbb volt. A 86 százalékot elérő Gemini válaszai ugyanakkor nem voltak olyan alaposak, mint a ChatGPT-é vagy Claude-é. Nem érvelt annyira világosan, de a válaszai tömörek és egyértelműek voltak.

Chatgpt,,Using,And,Chatting,Artificial,Intelligence,Chatbot,Developed,By,Openai. — A mesterséges intelligencia egyre nagyobb pontossággal válaszol meg összetett orvosi kérdéseket is / Fotó: Shutterstock

A Grok, az Elon Musk-féle xAI csevegőbotja is figyelemre méltó eredmény ért el – 84 százalékot –, de az elemzők szerint nem szolgált kielégítő érveléssel, nehéz volt megérteni, hogyan jutott el a válaszokhoz. Ebben a mérésben utolsó helyen a HuggingChat végzett 66 százalékkal: a helyesen megválaszolt kérdéseket jól megindokolta, tömör válaszokat és forráshivatkozásokat is adott.

Mi a tanulság? A chatbot okosabb, mint az orvos?

Az elemzők hangsúlyozzák: ezeket a modelleket nem orvosi érvelésre tervezték, a fogyasztói technológiai szektor termékei, elsősorban olyan feladatok elvégzésére szánták, mint a fordítás és a tartalomgyártás.

Ehhez képest az derült ki, hogy klinikai érvelésre is képesek, egészen kiváló eredménnyel.

A fejlesztők már foglalkoznak olyan platformok építésével, amelyek kifejezetten az egészségügyi problémák megoldásában fognak segíteni.

A Google a közelmúltban bemutatta a Med-Geminit, a korábbi Gemini-modellek továbbfejlesztett változatát, amely webalapú keresésre is képes a klinikai gondolkodás javítására.

A szakértők azt mondják, ahogy a mesterséges intelligencia, ezek a nyelvi modellek is fejlődnek. Ezzel egy időben fejlődik az összetett egészségügyi adatok elemzése is, valamint egyre jobban tudnak diagnosztizálni és kezeléseket ajánlani. Olyan szintű precizitást és következetességet kínálhatnak, amely kizárja például az orvos fáradtságából eredő tévedést. Ez pedig utat nyit egy olyan jövő felé, ahol az orvosi ellátásra fejlesztett portálokat nem orvosok, hanem gépek is működtethetik.

Origo.hu

Valósággal szivattyúzzák ki a pénzt a magyarok - már több mint 2000 milliárd forintnyi vagyont tartanak külföldi bankbetétekben

Beol.hu

Nagy nyelvi modellek az orvosok ellen – hihetetlen eredmény született

Nagy nyelvi modellek vs. orvos?

Nem egyformán teljesítettek a chatbotok

Mi a tanulság? A chatbot okosabb, mint az orvos?

Videó bizonyítja: a Tyson-Paul bokszmeccs csalás volt?

Andrei Mangra ügye: ez vár a sztártáncosra, ha elszökik Magyarországról

Megváltozott Demcsák Zsuzsa arca: így néz ki a plasztika beavatkozás után

Valósággal szivattyúzzák ki a pénzt a magyarok - már több mint 2000 milliárd forintnyi vagyont tartanak külföldi bankbetétekben

Karambol a csabai Lencsésin, két személyautó ütközött

Szörnyű dolgot követett el az Ikea, súlyos kártérítést kell fizetnie

7 mennyei finom sült, amivel elkápráztathatod a húsimádó családtagokat

Fordulat: Karácsony Gergely döntött a főpolgármester-helyettesekről – óriási meglepetés Budapesten

Mutatjuk, hol kell előkészíteni a hólapátot, több centi hó is eshet

Magyar Péter megfenyegette a gyermekotthon vezetőjét: „Ennek k…rva nagy következményei lesznek”

Címoldalról ajánljuk

Új fejlemények az óriási M6-os balesetről: gerincsérült is van a sérültek között

Megindult a sajtóhadjárat a gazdasági döntéshozók hitelének aláásására

Terjeszkedik Magyarországon a népszerű étteremlánc

Címoldalról ajánljuk

Hihetetlen pénzeket kaszált ezen a befektetésen, aki időben kapcsolt

A Magyar Fejlesztési Bank hírei

Digitális állampolgárság: Rogán Antal elárulta, kötelező lesz-e

Eszkaláció: atomtöltetet is képes szállítani az a rakéta, amit az oroszok Ukrajnára lőttek

Munkácsy Mihály egyik festménye hatalmas meglepetésre most került elő Ausztráliából: több mint 100 milliót ér a kép

OTP: itt a második 27 ezres árcédula, elképesztő rali jöhet

Támadást tervezett a New York-i tőzsde ellen: őrizetbe vették a férfit

Budapesti Értéktőzsde

Podcastok

Még mindig akciósak az építőanyagok, tele vannak a raktárak

Ezért diplomáciai siker a Budapest-nyilatkozat elfogadása

Busás osztalék jöhet a Magyar Telekomnál, de a Richtert sem kell félteni

Megindult a sajtóhadjárat a gazdasági döntéshozók hitelének aláásására

A Trump-effektus: milyen hatása lehet a kriptopiacra a régi-új elnök visszatérésének?

Nagy nyelvi modellek az orvosok ellen – hihetetlen eredmény született

Nagy nyelvi modellek vs. orvos?

Nem egyformán teljesítettek a chatbotok

Mi a tanulság? A chatbot okosabb, mint az orvos?

Videó bizonyítja: a Tyson-Paul bokszmeccs csalás volt?

Andrei Mangra ügye: ez vár a sztártáncosra, ha elszökik Magyarországról

Megváltozott Demcsák Zsuzsa arca: így néz ki a plasztika beavatkozás után

Valósággal szivattyúzzák ki a pénzt a magyarok - már több mint 2000 milliárd forintnyi vagyont tartanak külföldi bankbetétekben

Karambol a csabai Lencsésin, két személyautó ütközött

Szörnyű dolgot követett el az Ikea, súlyos kártérítést kell fizetnie

7 mennyei finom sült, amivel elkápráztathatod a húsimádó családtagokat

Fordulat: Karácsony Gergely döntött a főpolgármester-helyettesekről – óriási meglepetés Budapesten

Mutatjuk, hol kell előkészíteni a hólapátot, több centi hó is eshet

Magyar Péter megfenyegette a gyermekotthon vezetőjét: „Ennek k…rva nagy következményei lesznek”

Címoldalról ajánljuk

Új fejlemények az óriási M6-os balesetről: gerincsérült is van a sérültek között

Megindult a sajtóhadjárat a gazdasági döntéshozók hitelének aláásására

Terjeszkedik Magyarországon a népszerű étteremlánc

Címoldalról ajánljuk

Legolvasottabb

Új fejlemények az óriási M6-os balesetről: gerincsérült is van a sérültek között

Terjeszkedik Magyarországon a népszerű étteremlánc

Kétéves csúcson a dollár, meddig esik még a forint?

Orbán Viktor: a saját utunkat kell járni, és nem a Nyugatot kell másolni

Ursula von der Leyen életveszélyes helyzetbe került – de megoldotta

Hihetetlen pénzeket kaszált ezen a befektetésen, aki időben kapcsolt

A Magyar Fejlesztési Bank hírei

Digitális állampolgárság: Rogán Antal elárulta, kötelező lesz-e

Eszkaláció: atomtöltetet is képes szállítani az a rakéta, amit az oroszok Ukrajnára lőttek

Munkácsy Mihály egyik festménye hatalmas meglepetésre most került elő Ausztráliából: több mint 100 milliót ér a kép

OTP: itt a második 27 ezres árcédula, elképesztő rali jöhet

Támadást tervezett a New York-i tőzsde ellen: őrizetbe vették a férfit

Budapesti Értéktőzsde

Podcastok

Még mindig akciósak az építőanyagok, tele vannak a raktárak

Ezért diplomáciai siker a Budapest-nyilatkozat elfogadása

Busás osztalék jöhet a Magyar Telekomnál, de a Richtert sem kell félteni

Megindult a sajtóhadjárat a gazdasági döntéshozók hitelének aláásására

A Trump-effektus: milyen hatása lehet a kriptopiacra a régi-új elnök visszatérésének?