Cinsiyet Gelişim Bozukluklarının Yönetiminde Büyük Dil Modellerinin Karşılaştırmalı Analizi: Klinik Kılavuzlara Dayalı Bir Değerlendirme
SAİME SÜNDÜS UYGUN, Fatma Özcan Sıkı
- Yıl : 2025
- Cilt : 41
- Sayı : 4
- Sayfa :
201-204
Amaç: Bu çalışma, günümüzde yaygın olarak kullanılan iki yapay zekâ tabanlı sohbet sistemi olan ChatGPT ve Bing AI'nin, Türk Neonatoloji Derneği tarafından yayımlanan Cinsiyet Gelişim Bozuklukları kılavuzunda yer alan klinik önerilerle uyum düzeylerini karşılaştırmayı amaçlamaktadır. Gereç ve Yöntemler: Türk Neonatoloji Derneği Cinsiyet Gelişim Bozuklukları kılavuzuna dayalı olarak hazırlanmış 40 sorudan oluşan standart bir değerlendirme seti kullanılmıştır. Sorular, klinik karar verme süreçlerini yansıtan altı ana kategori altında gruplandırılmış ve tamamı hem ChatGPT hem de Bing AI'ya yöneltilmiştir. Tüm sorular yazılı metin formatında iletilmiştir. Yanıtlar, kılavuzla uyum açısından biri neonatoloji, diğeri çocuk cerrahisi uzmanı olmak üzere iki bağımsız uzman tarafından 5 puanlık Likert ölçeği ile değerlendirilmiştir. Her kategori için ChatGPT ve Bing AI’nin ortalama puanları hesaplanmış, bu puanlar arasındaki fark Wilcoxon işaretli sıra testi ile istatistiksel olarak karşılaştırılmıştır.
Bulgular: ChatGPT, altı kategorinin tamamında Türk Neonatoloji Derneği’nin Cinsiyet Gelişim Bozuklukları kılavuzu ile yüksek düzeyde uyum göstermiştir (ortalama puan: 4,88). Buna karşın, Bing AI bazı kategorilerde daha düşük uyum sergilemiştir (ortalama puan: 3,25). İki sistem arasındaki ortalama puan farkları tüm kategorilerde istatistiksel olarak anlamlı bulunmuştur (p<0,05). Özellikle tanı süreci/laboratuvar testleri ve tedavide multidisipliner yaklaşım kategorilerinde Bing AI’nın performansı belirgin şekilde düşüktür.
Sonuç: ChatGPT, Cinsiyet Gelişim Bozuklukları konusunda kılavuz temelli klinik destek sağlama açısından Bing AI'ya göre daha yüksek doğruluk ve tutarlılık göstermiştir. Güncel klinik kılavuzlarla uyumlu yapay zekâ destekli sistemlerin kullanımı, karmaşık ve multidisipliner karar verme süreçlerinde hekimleri destekleme potansiyeline sahiptir. Bu nedenle, klinik uygulamalarda kullanılacak yapay zekâ araçlarının seçimi, bu tür sistematik değerlendirmelere dayanmalıdır. Güvenilir yapay zekâ tabanlı sistemler, hasta yönetiminde klinisyenlere önemli katkılar sağlayabilir.
Atıf yapmak için :
Uygun SS, Ozcan Siki F. A Comparative Analysis of Large Language Models in Managing Disorders of Sex Development: Evaluation Based on Clinical Guidelines. Selcuk Med J 2025;41(4): 201-204
Download Citation: Endnote/Zotero/Mendeley (RIS) RIS File
Download Citation: BibTeX BibTeX File
Açıklama :
Yazarların hiçbiri, bu makalede bahsedilen herhangi bir ürün,
aygıt veya ilaç ile ilgili maddi çıkar ilişkisine sahip değildir. Araştırma,
herhangi bir dış organizasyon tarafından desteklenmedi.Yazarlar çalışmanın
birincil verilerine tam erişim izni vermek ve derginin talep ettiği takdirde
verileri incelemesine izin vermeyi kabul etmektedirler.
Cinsiyet Gelişim Bozukluklarının Yönetiminde Büyük Dil Modellerinin Karşılaştırmalı Analizi: Klinik Kılavuzlara Dayalı Bir Değerlendirme
2025,
Vol.
41
(4)
Geliş Tarihi : 10.05.2025,
Kabul Tarihi : 19.10.2025,
Yayın Tarihi : 11.12.2025
Selçuk Tıp Dergisi
ISSN:1017-6616;
E-ISSN:2149-8059;