A GPT-4o az esetek 93 százalékában azonosította az aknét és a rosaceát, szemben a Google Gemini Flash 2.0-s modelljével, amely az esetek mindössze 21 százalékában ismerte fel a kórképeket – derült ki a Semmelweis Egyetem új klinikai kutatásából. A kutatók véleménye szerint a mesterséges intelligencia hosszú távon csökkentheti az időt, amíg a beteg ellátáshoz jut, ezzel pedig segíthet megelőzni az állapot rosszabbodását. A végleges diagnózis felállítása azonban továbbra is szakorvosi feladat marad – hangsúlyozták a szerzők.
A nagy kérdés: „mi lehet a legvalószínűbb diagnózis?”
A kutatók olyan betegek fotóit mutatták meg a két mesterségesintelligencia-modellnek, akiknél szakorvosi diagnózis igazolta az akné vagy a rosacea fennállását. A fotók feltöltése után az MI-modellektől azt kérdezték: „Mi lehet a legvalószínűbb diagnózis?”, úgy fogalmazva, mintha a kérdés egy laikus felhasználótól érkezne. Helyes válasz esetén a modelleknek a bőrbetegség altípusát is meg kellett nevezniük. A vizsgálatban nemzetközi bőrgyógyász szakértők is részt vettek, köztük a Yale Egyetem elismert mesterségesintelligencia-kutatója.
Az akné és a rosacea rendkívül gyakori bőrproblémák, amelyek jelentősen ronthatják az életminőséget. Diagnosztizálásuk azonban nem mindig egyszerű, mivel a tüneteik sokszor hasonlóak”
– hangsúlyozta dr. Kiss Norbert, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinikájának adjunktusa, a tanulmány levelező szerzője.
„Minket is meglepett, mennyire jól teljesített a ChatGPT”
A tudósok azt látták, hogy a GPT-4o 100 százalékban adott betegségmeghatározást, és 93 százalékos pontossággal azonosította be a kórképeket. Egészen pontosan az akné esetében 91 százalékos, a rosaceával kapcsolatban pedig 100 százalékos találati arányt ért el, és más betegségeket szinte soha nem kevert össze ezekkel. Az altípusok meghatározása azonban már komolyabb kihívást jelentett a rendszernek: az akné altípusait az 55, a rosacea altípusait pedig 50 százalékban találta el helyesen. Ezzel szemben a Gemini Flash 2.0 a páciensek kevesebb mint negyedénél (21%) ismerte fel a kórképeket, így a kutatók ennél a modellnél nem végeztek további statisztikai értékelést.
Minket is meglepett, mennyire jól teljesített a ChatGPT. A betegek sokszor szkeptikusak az MI használatát illetően, és az orvosok sem mindig bíznak ezekben az eszközökben. Ezért is tartottuk fontosnak, hogy tudományos vizsgálatban mérjük fel, valójában mire képesek” – mondta dr. Kiss Norbert.
A szakértők ugyanakkor kiemelték, hogy nagyon fontos, hogy a páciensek tisztában legyenek a rendszer korlátaival, amikor mesterségesintelligencia-alkalmazással végeznek önellenőrzést. „A végleges diagnózis felállítása és a vényköteles gyógyszerek felírása továbbra is a bőrgyógyász szakorvos feladata marad” – emelte ki dr. Bánvölgyi András, a Semmelweis Egyetem Bőr-, Nemikórtani és Bőronkológiai Klinika Általános és Teledermatológiai Ambulancia vezetője.