Cinsiyet Gelişim Bozukluklarının Yönetiminde Büyük Dil Modellerinin Karşılaştırmalı Analizi: Klinik Kılavuzlara Dayalı Bir Değerlendirme

SAİME SÜNDÜS UYGUN

doi:10.30733/std.2025.01852

Cinsiyet Gelişim Bozukluklarının Yönetiminde Büyük Dil Modellerinin Karşılaştırmalı Analizi: Klinik Kılavuzlara Dayalı Bir Değerlendirme

SAİME SÜNDÜS UYGUN, Fatma Özcan Sıkı

Year : 2025
Vol : 41
Issue : 4
Page : 201-204

DOI : 10.30733/std.2025.01852

Amaç: Bu çalışma, günümüzde yaygın olarak kullanılan iki yapay zekâ tabanlı sohbet sistemi olan ChatGPT ve Bing AI'nin, Türk Neonatoloji Derneği tarafından yayımlanan Cinsiyet Gelişim Bozuklukları kılavuzunda yer alan klinik önerilerle uyum düzeylerini karşılaştırmayı amaçlamaktadır. Gereç ve Yöntemler: Türk Neonatoloji Derneği Cinsiyet Gelişim Bozuklukları kılavuzuna dayalı olarak hazırlanmış 40 sorudan oluşan standart bir değerlendirme seti kullanılmıştır. Sorular, klinik karar verme süreçlerini yansıtan altı ana kategori altında gruplandırılmış ve tamamı hem ChatGPT hem de Bing AI'ya yöneltilmiştir. Tüm sorular yazılı metin formatında iletilmiştir. Yanıtlar, kılavuzla uyum açısından biri neonatoloji, diğeri çocuk cerrahisi uzmanı olmak üzere iki bağımsız uzman tarafından 5 puanlık Likert ölçeği ile değerlendirilmiştir. Her kategori için ChatGPT ve Bing AI’nin ortalama puanları hesaplanmış, bu puanlar arasındaki fark Wilcoxon işaretli sıra testi ile istatistiksel olarak karşılaştırılmıştır.
Bulgular: ChatGPT, altı kategorinin tamamında Türk Neonatoloji Derneği’nin Cinsiyet Gelişim Bozuklukları kılavuzu ile yüksek düzeyde uyum göstermiştir (ortalama puan: 4,88). Buna karşın, Bing AI bazı kategorilerde daha düşük uyum sergilemiştir (ortalama puan: 3,25). İki sistem arasındaki ortalama puan farkları tüm kategorilerde istatistiksel olarak anlamlı bulunmuştur (p<0,05). Özellikle tanı süreci/laboratuvar testleri ve tedavide multidisipliner yaklaşım kategorilerinde Bing AI’nın performansı belirgin şekilde düşüktür.
Sonuç: ChatGPT, Cinsiyet Gelişim Bozuklukları konusunda kılavuz temelli klinik destek sağlama açısından Bing AI'ya göre daha yüksek doğruluk ve tutarlılık göstermiştir. Güncel klinik kılavuzlarla uyumlu yapay zekâ destekli sistemlerin kullanımı, karmaşık ve multidisipliner karar verme süreçlerinde hekimleri destekleme potansiyeline sahiptir. Bu nedenle, klinik uygulamalarda kullanılacak yapay zekâ araçlarının seçimi, bu tür sistematik değerlendirmelere dayanmalıdır. Güvenilir yapay zekâ tabanlı sistemler, hasta yönetiminde klinisyenlere önemli katkılar sağlayabilir.

Cite this Article As : Uygun SS, Ozcan Siki F. A Comparative Analysis of Large Language Models in Managing Disorders of Sex Development: Evaluation Based on Clinical Guidelines. Selcuk Med J 2025;41(4): 201-204

Download Citation: Endnote/Zotero/Mendeley (RIS) RIS File

Download Citation: BibTeX BibTeX File

Description : None of the authors, any product mentioned in this article, does not have a material interest in the device or drug. Research, not supported by any external organization. grant full access to the primary data and, if requested by the magazine they agree to allow the examination of data.

Cinsiyet Gelişim Bozukluklarının Yönetiminde Büyük Dil Modellerinin Karşılaştırmalı Analizi: Klinik Kılavuzlara Dayalı Bir Değerlendirme
2025, Vol. 41 (4)

Received : 10.05.2025, Accepted : 19.10.2025, Published Online : 11.12.2025