Her gün bizi daha da şaşırtan yapay zekâ teknolojileri, farklı alanlarda insanların yerini doldurabilecek yetenekler kazanıyor. Tıp da bunlardan biri. Daha evvel birkaç kere yapay zekânın hekimlerden daha uygun performans verdiğini görmüştük. Artık bunlara bir yenisi daha eklendi.
Google, kendi geliştirdiği bir lisan modelini (LLM) temel alan bir sohbet botu hakkında çalışma yayımladı. Çalışmada, sohbet botunun tıbbi görüşmelerde hekimlerden daha yeterli performans sergilediği görüldü.
Doktorlardan daha yeterli hastalık teşhis etti, daha âlâ empati kurdu
Articulate Medical Intelligence Explorer (AMIE) ismi verilen model, hastalarla konuşma ve hastaların tıbbi geçmişine dayanarak muhtemel teşhisleri listeleme konusunda doktorlardan daha başarılı oldu. Şimdi akran değerlendirmesinden geçmeyen çalışma, 11 Ocak’ta arXiv’de ön baskı olarak yayımlandı.
Google araştırmacıları, modelin teneffüs ve kardiyovasküler hastalıkları daha düzgün teşhis edebildiğini söylüyor. Ayrıyeten görüşmelerde gerçek tabiplerle emsal ölçü bilgiyi elde edebildiğini, hatta daha uygun empati kurabildiğini de ekliyor.
Ancak modelin şimdi gerçek hastalar üzerinde test edilmediğini vurgulamak gerek. Çalışmada, yalnızca hastaları canlandıran aktörler kullanıldı. Esasen araştırmacılar da modeli “deneysel” olarak nitelendirdi ve şimdi bir şey söylemek için çok erken olduğunu aktardı.
20 oyuncu, çalışma kapsamında 149 farklı klinik senaryoyu simüle ettiler. Görüşmeler de yüz yüze değil, metin tabanlı olarak gerçekleştirildi. Oyuncular, görüşmeler sırasında gerçek tabiplerle mı yoksa sohbet botuyla mı konuştuklarını bilmiyorlardı. Bir küme uzman da AMIE’nin ve hekimlerin performansını kıymetlendirdi. Nezaket, durumu ve tedaviyi açıklama, dürüst görünme, teşhis üzere şeylerin incelendiği çalışmalar sonucunda ise sohbet botunun 26 kriterin 24’ünde tabipleri geçtiği görüldü.
AMIE, tabiplerden daha güzel sonuçlar verse de onların yerini almayacak
Tabii ki bu sonuçlar yapay zekânın hekimlerin yerini alacağı manasına gelmiyor. Google araştırmacısı Alan Karthikesalingam da mevzuya ait “Bu, hiçbir halde bir lisan modelinin tıbbi görüşmelerde tabiplerden daha düzgün olduğu manasına gelmez.” ifadelerini kullandı. Öte yandan Harvard’da doktor olarak görev yapan Adam Rodman da aracın yararlı olabileceğini fakat tabiplerin yerine geçemeyeceğini söyledi: “Tıp, bilgi toplamaktan daha fazlasıdır. Tamamen insan ilgileriyle alakalıdır.”
Araştırmayla ilgili şunu da eklemek gerek. Katılan hekimler hiç bu türlü metin tabanlı görüşmeler gerçekleştirmeye alışık değillerdi. Bu da performanslarını etkileyip yapay zekânın öne geçmesine neden olmuş olabilir.
Yine de çalışma, yapay zekânın empati kurabilen ve hastanın geçmişinden yola çıkarak teşhis koyabilen bir tabiplere benzeri formda performans gösterme potansiyelinin olduğunun göstergesi. Bu araştırmanın sonraki adımı da potansiyel ön yargıları kıymetlendirmek ve sistemin farklı popülasyonlarda emsal sonuçlar vermesini sağlamak için daha detaylı çalışmalar yapmak.
Daha evvel de tıp alanında benzeri yapay zekâ gelişmeleri görmüştük. Bunlardan kimilerine aşağıdaki içeriklerimizden göz atabilirsiniz: