Büyük dil modellerinin hayatımızda belirli alanlarda kolaylık sağladığı şüphesiz bir gerçek. Özellikle yanıtını kısa sürede bulmak istediğimiz bir soruyu, arama motorlarına sormaktansa direkt ChatGPT ya da DeepSeek gibi modellere sorup yanıt almak daha pratik.
Ancak bu modellerin tamamının bir sorunu var. Bu modeller biraz “yalancılar”. Yani olmamış bir şeyi uydurabiliyorlar ve bunu da kendilerinden çok emin bir şekilde yapıyorlar.
Ben yalancılık diyorum ama, dil modellerinin bu spekülasyon üretmesine henüz evrensellik kazanmasa da genellikle halüsinasyon deniyor. 2024’te yayınlanan bir makalede olduğu gibi “saçmalıyor” diyenler de var.
Mesajı vermek adına başlıkta yalancı ifadesini kullansak da yazı boyunca halüsinasyon terimi üzerinden ilerleyeceğiz. Peki halüsinasyon nedir?
Büyük dil modelleri özelinde halüsinasyon, girdi olarak yazdığınız gönderinizle alakasız, uydurma ya da tutarsız içerik üretimi olarak tanımlanabilir. Bu durum dil modellerinin yaratıcılığını gösterirken aynı zaman da gerçeği bükme, sansürleme gibi tehlikeli potansiyellerini de yansıtıyor.
Halüsinasyonlar genellikle iki farklı grupta inceleniyor. Gerçeklik ve sadakat/bağlılık halüsinasyonu.
Gerçeklik halüsinasyonu, modelin ürettiği içerik, doğrulanabilir gerçeklerle çeliştiğinde ortaya çıkar. Örneğin, “UEFA 2000 şampiyonu Galatasaray’dır ” yerine yanlışlıkla “17 Mayıs 2000 tarihindeki UEFA Kupası finalini Arsenal kazandı.” demek gibi. Bu durum, yanlış bilgi yayılmasına ve modelin güvenilirliğinin azalmasına yol açar.
Sadakat ya da bağlılık halüsinasyonları ise üretilen içerik, kullanıcı talimatlarına veya verilen bağlama uyumlu olmadığında görülür. Örneğin, bir haberdeki gerçekte 2025 olan bilgiyi 2020 olarak değiştirmek ya da A kişisinin yazdığı bir makalenin yazarını B kişisi yazmış gibi lanse etmek.
Bu halüsinasyonların ise en belirgin olduğu yerlerden bir tanesi modellerin akademik makaleler için ürettikleri referanslar. En son çıkan modeller de dahil, bir literatür taraması ya da alanla ilgili makale yapılması istendiğinde modellerin yüzde 30 ile yüzde 90 arasında hatalı referans verdiği görülmüş. Yani bu modeller başlık, birinci yazar ve basım yılından en az ikisini hatalı olarak.
Modellerin bu halüsinasyonu ortadan kaldırılabilir mi? Nature’de Nicola Jones’in yazdığı makale bu soruya bir yanıt arıyor ve aslında o yanıtı da kendi başlığında veriyor. Modellerin halüsinasyon yapması azaltılabilir, ancak durdurulamaz.
Peki modeller neden yalan söyler?
Bu soruya detaylı bir yanıt vermek zor, çünkü modellerin temel çalışma prensipleri bilinse de detayları bilinmiyor. Ancak genel olarak argümanlar sağlamak mümkün.
İlk olarak modellerin kelimelerden sayılara geçişindeki yaşanan bilgi kaybı. Büyük dil modelleri prensip olarak kendisine eğitim için verilen metin verilerindeki ilişkileri anlamaya çalışır, onları sayısal parametrelere döker. Bu parametreler yardımıyla da bir cümlede a kelimesinden sonra gelecek en yüksek olasılığa sahip a1 kelimesini doğru bir şekilde tahmin etmeye çalışır. İşte bu transfer sırasında modeller, kendilerine verilen metin verisindeki bilgilerin hepsini öğrenemez ve bir kısmını kaybeder. Bu kayıp bilgi oranının yüzde 2 olduğu tahmin ediliyor.
Bu uydurmaların bir diğer sebebi ise modelin sahip olduğu eğitim verisindeki hatalı bilgiler. Eğer bu modeller hatalı bilgilere sahip bir veriyle eğitilirse ki internet ortamından alınan verilerin kullanıldığı düşünüldüğünde bu çok olası, dolayısıyla hatalı bilgi vermeye yatkın oluyorlar. Yine bahsettiğimiz Nature makalesinden örnek verirsek, bir sohbet robotunun pizza sosuna peynirin kaymasını önlemek için tutkal eklemeyi önermesi, sosyal ağ Reddit’te (muhtemelen alaycı) bir gönderiye dayanıyordu.
Aklınıza şu fikir gelmiş olabilir, o zaman eğitim verisi temizse, model halüsine etmeyebilir. Ne yazık ki bu sorunun cevabı da hayır. Modeller içindeki eğitim verisinde bir kere var olan bilgi sayısına orantılı bir şekilde halüsine etmeye devam edecekler, çünkü yeteri kadar o bilgiyi öğrenmemiş olacaklar.
Bu sorun nasıl çözülür?
Halüsinasyonu tamamen çözmek imkânsız, ama azaltmak mümkün. Makale bunun yollarını da içeriyor.
Daha fazla parametreye sahip ve daha uzun süre eğitilmiş modeller kullanmak halüsinasyonu şüphesiz azaltacaktır, ancak bunun hesaplama maliyeti oldukça yüksek olacak.
Bir başka çözüm ise Erişim Destekli Üretim (Retrieval Augmented Generation (RAG)). Bu yöntemde, modeller bir soruya yanıt verirken sadece kendi bilgilerini değil, güvenilir dış kaynakları da kullanır. Fakat sınırlı erişim, sınırsız bilgi paradoksu bu yaklaşımın etkisini kısıtlamakta. Hesaplama maliyeti de bir başka sorun bu metot içerisinde.
Kullanıcı sorgulaması bir başka çözüm ki bu aynı zamanda en pratik olan yollardan bir tanesi, çünkü kullanıcılar tarafından uygulanması da mümkün. Bu yöntemde kullanıcılar, modele tekrar tekrar üretilen bilgiye dair sorgulayıcı sorular sorduğunda hatalı ve çelişkili yanıtlar alıyorsa bu da halüsinasyonun fark edilmesi ve azaltılması için kullanılıyor.
Ne yapmalıyız?
Çözüm aslında basit. Kullanmak ama güvenmemek. Elde ettiğimiz bilgiyi, özellikle çok önemli durumlarda tekrar tekrar kontrol etmek gerekiyor. Yoksa sonumuz Amerika’da mahkemede ChatGPT’den aldığı gerçek olmayan bilgiyi gerçek olduğunu düşünerek kullanan avukata benzer.
Referanslar
Jones, N. (2025). AI hallucinations can’t be stopped — but these techniques can limit their damage. Nature, 637(8047), 778–780. https://doi.org/10.1038/d41586-025-00068-5
Bohannon, M. (2023, June 8). Lawyer used ChatGPT in Court—And cited fake cases. A judge is considering sanctions. Forbes. https://www.forbes.com/sites/mollybohannon/2023/06/08/lawyer-used-chatgpt-in-court-and-cited-fake-cases-a-judge-is-considering-sanctions/