Mayıs 2023'te New York'ta bir avukat, ChatGPT'nin ürettiği dava referanslarını mahkeme dilekçesine ekledi. Sorun şuydu: O davalar hiç olmamıştı. ChatGPT onları icat etmişti.
Bu vaka yapay zekanın iş hayatındaki en önemli riskini gün yüzüne çıkardı: "Hallucination" — yani modelin emin bir tonla tamamen yanlış veya uydurma bilgi üretmesi. ChatGPT'yi her gün kullananlar için bu risk gerçek ve ölçülebilirdir. Ancak doğru anlayışla bu araç inanılmaz derecede güçlü de olabilir.
Gerçek Dava: Mata v. Avianca (2023)
Mayıs 2023'te ABD'nin New York Southern District Court'unda görülen Mata v. Avianca davasında avukat Steven Schwartz, müvekkilinin lehine emsal oluşturması için ChatGPT'den dava araştırması yapmasını istedi. ChatGPT şu davaları "buldu": Varghese v. China Southern Airlines Co. Ltd., Shaboon v. Egyptair, Petersen v. Iran Air...
Sorun şuydu: Bu davaların hiçbiri gerçek değildi. ChatGPT, gerçekmiş gibi görünen, mantıklı hukuki dil kullanan ama tamamen hayali dava referansları üretmişti. Hakim P. Kevin Castel, avukata ve hukuk firmasına toplam 5.000 dolar para cezası verdi ve her iki avukata da faaliyetlerini izleme tedbirleri uyguladı. Dava, ABD hukuk dünyasında yapay zeka uyarılarının simgesi haline geldi.
Büyük dil modelleri (LLM), dil kalıplarına dayanarak metin üretir — bilgi veritabanından değil. Bu yüzden model "bilmediğini" söylemek yerine mantıklı görünen ama yanlış bir cevap üretebilir. Buna "hallucination" denir. Ses tonu ve yazım kalitesi ne kadar güvenilir görünse de içerik hatalı olabilir.
Sayılarla Hallucination Riski
Büyük dil modelleri metin özetleme görevlerinde farklı oranlarda hallucination üretmektedir. Modelin ses tonu ne kadar güvenilir görünse de içerik yanlış olabilir; bu durum marka metni, hukuki belge veya mali hesaplama gibi kritik çıktılar için özellikle risk oluşturur.
LLM'lerin faktüel doğruluk testlerinde insan uzmanların gerisinde kaldığı akademik çevrelerce genel olarak kabul görmektedir. Yüksek kaliteli yanıt üretilen alanlarda bile doğrulama yapılmadan sonuçlara güvenmek, özellikle Türkiye'ye özgü mevzuat konularında ciddi hata riskini beraberinde getirir.
OpenAI'nin açıklamalarına göre ChatGPT-4o'nun eğitim verisi Nisan 2024'te sona ermektedir. Bu tarihten sonra gerçekleşen mevzuat değişiklikleri, vergi düzenlemeleri, piyasa verileri veya haberler hakkında bilgisi yoktur. Arama özelliği kapalıyken bu konularda tahmin üretir.
Türkçe Sorgularda Risk Neden Daha Yüksek?
İnternetin genel içeriğinde İngilizce metin, Türkçe metinden çok daha fazladır. Bu dengesizlik, yapay zeka modellerinin İngilizce konularda daha güçlü kalmasına yol açar. Türk vergi mevzuatı, Türk iş hukuku, yerel piyasa koşulları veya Türkiye'ye özgü düzenlemeler söz konusu olduğunda model daha az veriye dayanmakta ve hata payı artmaktadır.
Bir sigorta acentesinin 2024 DASK limit bilgilerini, bir muhasebecinin güncel KDV oranlarını veya bir avukatın son Yargıtay kararlarını ChatGPT'ye sorması ciddi risk taşır.
ChatGPT'nin Güvenilir ve Güvenilmez Olduğu Alanlar
| Görev Türü | Güvenilirlik | Açıklama |
|---|---|---|
| E-posta taslağı yazma | Yüksek | Format ve dil kalitesi için idealdir; içerik sizden gelir |
| Beyin fırtınası ve fikir üretme | Yüksek | Yaratıcı süreçleri hızlandırır, başlangıç noktası verir |
| Kod yazma ve hata ayıklama | Yüksek | Özellikle yaygın diller ve kütüphanelerde oldukça güçlüdür |
| Metin özetleme ve düzenleme | Orta | Genel doğrulukta iyidir; nüanslı konularda çapraz kontrol yapın |
| Güncel haber ve veri | Düşük | Bilgi kesme tarihinden sonraki gelişmeleri bilmez |
| Hukuki tavsiye ve dava araştırması | Düşük | Schwartz davası bu riskin somut kanıtıdır |
| Tıbbi tanı ve ilaç bilgisi | Düşük | Kesinlikle uzman görüşü ile teyit edilmelidir |
| Türkiye'ye özgü mevzuat | Düşük | Az Türkçe veri + bilgi kesme tarihi = yüksek hata riski |
ChatGPT'yi Doğru Kullananlar Ne Yapıyor?
1. Kaynak İsteme
ChatGPT'ye bir bilgi sorduğunuzda "Bu bilginin kaynağını belirt ve hangi tarihli olduğunu söyle" diye ekleyin. Model kaynak gösterdiğinde bu kaynakları kendiniz doğrulayın. Kaynaksız güvenmek risklidir.
2. Çapraz Kontrol (Cross-Check)
Önemli bir bilgiyi birden fazla kaynakla doğrulayın. ChatGPT, Gemini veya Claude'dan farklı sonuçlar geliyorsa bu, o konuda kesinlik olmadığının işaretidir.
3. Görev Odaklı Kullanım
ChatGPT'yi bir "araştırmacı" değil "editör" olarak kullanın. Siz doğru bilgiyi getirin, o organize etsin, dil kalitesini artırsın, formatı düzenlesin. Bu kombinasyon en verimli ve güvenli kullanım biçimidir.
4. Arama Modunu Açın
ChatGPT'nin "Ara" (browse) özelliği aktifken model güncel web sayfalarını tarayabilir. Bu mod kapalıyken 2024 öncesi verilerle yanıt üretir. Güncel konuları sormadan önce bu farkı bilin.
Yapay zekayı iş süreçlerinize entegre edin
Sonuç: Güçlü Araç, Bilinçli Kullanıcı
ChatGPT, tarihte geliştirilmiş en güçlü metin üretim araçlarından biridir. Ancak bir aracın gücü, onu kullananın bilinciyle anlam kazanır. Steven Schwartz'ın davası bize şunu öğretiyor: Ses tonu güvenilir, yazım kalitesi mükemmel, atıflar ikna edici olsa bile içerik doğrulanmamışsa sonuç felaket olabilir.
İş hayatında ChatGPT'yi editör, hız kazandırıcı ve organizasyon aracı olarak kullandığınızda değeri tartışılmazdır. Onu tek bilgi kaynağı olarak gördüğünüzde ise risk tamamen size aittir. Dijital sistemlerinizi yapay zeka ile güçlendirmek için doğru mimariyi kurmak bu farkı kapatır.