ChatGPT 3,5-4 farkı
Dr. Ayşe Ergüven, PhD. Biol
Bir bilgisayarın insan beynindekine benzer bir sinir ağı yapısını oluşturan ve bunu bir diyalog içinde kullanan, bunun için de doğal dil işlemeyi kullanan bir yapay zekâ (AI) sohbet robotudur, ChatGPT. Bir kelimenin sonrasında gelecek kelimenin ne olacağına ya da olabileceğine dair tahminler yapmak için kullanılan dil modeli sorulara (örneğin: bugün hava çok ____ gibi sorular) yanıt verebilir ve makaleler, sosyal medya gönderileri, makaleler, kodlar, e-postalar dahil olmak üzere çeşitli yazılı içerikler oluşturabilir. Bunları oluşturabilmek için kullandığı internet kaynakları içinde bunların bulunması gerekir. Bunu söylemek komik ama yapay zekâ da bir kaynakça altyapısına ihtiyaç duymaktadır. Yapay zekânın bu özelliklerini, genetik araştırmalarda kullanımı açısından değerlendiren bir çalışmayı paylaştım burada sizlerle.
“Seçilen genetik sorulara yanıt olarak ChatGPT 3.5 ve ChatGPT 4'ün karşılaştırmalı değerlendirmesi” adlı çalışma Amerika’dan çeşitli üniversitelerden bir grup araştırıcı ile yapılmış. Amaçlarını da “ChatGPT 3.5 (GPT-3.5) ile önceki bulgulara dayanarak, ChatGPT 4'ün (GPT-4) BRCA1, HFE ve MLH1 hakkında genetik bilgi sağlamadaki etkinliğini değerlendirmek ile tıbbi olarak ChatGPT kullanmanın faydasını, sınırlamalarını ve etik sonuçlarını değerlendirmek olarak belirtiyorlar.
Sorgu istemlerini geliştirirken üç uzman (bir klinik genetikçi ve iki genetik danışman) BRCA1, MLH1 ve HFE genlerine odaklanan altmış sekiz soru hazırlamış. Bu seçilen genler, klinik uygulamada gözlemlenme sıklıkları ve farklı kalıtım modelleri (BRCA1 ve MLH1 için otozomal dominant ve HFE için otozomal resesif) nedeniyle seçilmiş. Bu seçim, potansiyel genetik danışmanlık senaryolarına kapsamını genişletebilen sorular ile basit sorulardan karmaşık ve öznel sorulara kadar uzanan tipik hasta sorgularını yansıtacak şekilde tasarlanmış.

ChatGPT 3.5 ile yapılan araştırmanın tamamlanmasından çok kısa bir süre sonra ChatGPT 4.0 çıkınca çalışmayı tekrarlayarak ikisini karşılaştırmışlar, bu karşılaştırmada da iki temel hususa odaklanılmış:
- Yanıtın Doğruluğu: GPT-4'ün yanıtlarının gerçek doğruluğunun değerlendirilmesi.
- Sağlanan Bilgilerin Uygunluğu: GPT-4'ün yanıtlarının sorulan sorularla ne kadar alakalı olduğunun değerlendirilmesi.
Yapay zekânın gelişmesi özellikle ChatGPT gibi modellerle birlikte, genetik de dahil olmak üzere çeşitli alanlarda büyük gelişim göstermeye devam ediyor. Bu ilerlemeler heyecanla takip edilirken vurgulanması gereken önemli husus ise olası kötüye kullanım ve yanlış bilgilerin yayılması. Yazının başında da söylediğim gibi kaynak önemli çünkü.
Bu çalışmanın temel amacı ChatGPT'nin, özellikle de 4.0 versiyonunun genetik bilginin doğru ve etkili bir şekilde iletilmesindeki etkinliğini değerlendirmek. Selefi GPT-3.5 ile yapılan karşılaştırmalı analiz, yapay zekânın, dikkatli olunması gereken alanlarla da olsa, karmaşık genetik konuları ele alma becerisinde önemli ilerlemeler kaydettiğini ortaya çıkardı.
Ancak, GPT-4’te uzmanların işaretlediği çıktılar incelendikten sonra hataların genel olarak 2 kategoride toplandığı belirlenmiş.
- Geçmişte doğru olduğu düşünülen ancak bugün için kuşkulu olan önceki yönergelere uygun yanıtlar.
- Yanlış hesaplanmış veya yetersiz referans verilmiş hastalık riskleri.
Sonuçlar, GPT-4'teki gelişmelere rağmen yanıtlarda halâ hatalar olduğunu ve bu teknolojinin sağlık hizmetlerinde uygulanmasında zorlukların devam ettiğini gösteriyor. Bununla birlikte, bu özel sohbet robotu tıbbî durumlarla ilgili soruları yanıtlamak için tasarlanmamış olabilir ve aynı teknolojiyi kullanan, bu görev için özel olarak eğitilmiş ve genler/hastalıklarla ilgili kurallar ile beslenen (otozomal ,baskın ve çekinik kalıtım özellikleri gibi) bir platform muhtemelen daha iyi performans gösterecektir.
ChatGPT, yanlış olsalar bile iyi yapılandırılmış gibi görünen yanıtlar sağlayabilmektedir. Bu arama motorlarında yapay zekâ tarafından oluşturulan yanıtlar, geçmişte internet üzerinden alınan sonuçlardan daha ilgi çekici olabilir. Ama hep bir kuşku olmalı çünkü bu sonuçların özellikle tıbbi bakımı belirlemek için kullanma olasılığını artırabileceği göz önüne alınmalıdır.
Özetle, ChatGPT 3.5, ChatGPT 4.0 üzerinde, en azından bu çalışmada, işlenen genetik konularda belirgin bir fark yaratmamakta. Gelişmesi gerekli ve en önemlisi özel konularda yapılacak çalışmalar için çok çok dikkatli yaklaşılmalı bu kaynaklardan elde edilen cevaplara.

Bu yazıyı 30 Ağustos Zafer Bayramının 102. yıldönümü öncesinde yazdım. Aklımda sürekli büyük önder Mustafa Kemal Atatürk’ün ChatGPT’ye sorma olanağı olmadan 26 Ağustos 1922 günü düşmanın yenildiğine karar verip karşı taarruza geçme emrini nasıl verdiği sorusu vardı. Bizler bilgisayarda gördüğümüz her türlü ağ bilgisine o kadar güveniyoruz ki kendimize güvenmeyi unutuyoruz. Bir ekranda görünen bilginin doğru olduğuna inanıveriyoruz gibi geliyor bazen. Mustafa Kemal Atatürk ise içinde bulunduğu durumu aklı, bilgisi, becerisi, tecrübesi, algılama kapasitesi ile değerlendirerek kararını vermişti zafere giden yolda.
Topladığımız bilgiyi yapay zekâ üzerinden değerlendirirken kendi aklımıza da güvenmeyi unutmamalıyız.