OpenAI, amiral gemisi GPT-5’i tanıttı ve ChatGPT’nin varsayılan modeli olarak kullanıma sundu. Yeni mimari, o-serisinin akıl yürütme kabiliyetini GPT serisinin hızlı yanıtlarıyla birleştirerek sohbetten çok, görev tamamlayan “ajan” davranışına yaklaşıyor.

Şirket, GPT-5’in yalnızca yanıt üretmekle kalmayıp kullanıcı adına uygulama geliştirme, takvim yönetme ve kapsamlı araştırma brifleri hazırlama gibi işleri tamamlayabildiğini belirtiyor. Modeldeki gerçek zamanlı yönlendirici, gerektiğinde hızlı yanıt verip gerektiğinde daha uzun düşünme süresi ayırarak sonucu optimize ediyor.

Sohbetten Ajana Geçiş Vizyonu

OpenAI CEO’su Sam Altman, GPT-5’i “dünyanın en iyi modeli” olarak tanımlıyor ve bunu AGI hedefine ilerleyişte önemli bir adım olarak görüyor. Vizyon, kullanıcıların daha az ayar yaparak sonuç odaklı deneyim yaşaması.

Kullanıma Sunum ve Abonelikler

GPT-5, bugün itibarıyla ücretsiz ChatGPT kullanıcılarına da açılıyor. Plus aboneleri daha yüksek kota, Pro aboneleri sınırsız erişim ve ek kaynak kullanan GPT-5 Pro’ya sahip olacak. Kurumsal (Team, Edu, Enterprise) müşterilerde model gelecek hafta varsayılan hâle geliyor.

Performans: Kodlama Tarafında Öne Çıkıyor

OpenAI, GPT-5’in kodlama alanında sınırları zorladığını söylüyor. SWE-bench Verified testinde ilk denemede %74,9 başarı elde ederek Claude Opus 4.1’in %74,5’lik ve Gemini 2.5 Pro’nun %59,6’lık skorlarını geride bırakıyor. Ayrıca “vibe coding” denilen, sıfırdan uygulama geliştirme senaryolarında dikkat çekiyor.

GPT-5

Zorlu Testlerde Dengeli Tablo

“Humanity’s Last Exam” testinde GPT-5 Pro (araçlarla) %42 skor elde ederken, xAI’in Grok 4 Heavy modeli %44,4 ile öne geçiyor. GPQA Diamond’da ise GPT-5 Pro, %89,4’lük başarısıyla Claude Opus 4.1’in %80,9’unu ve Grok 4 Heavy’nin %88,9’unu geçmeyi başarıyor. Kısacası bazı alanlarda lider, bazılarında denk bir performans söz konusu.

Halüsinasyon Oranında Ciddi Düşüş

Sağlık odaklı HealthBench Hard Hallucinations testinde “düşünmeli” modda GPT-5’in halüsinasyon oranı %1,6’ya düştü. Bu seviye, önceki GPT-4o ve o3 modellerindeki çift haneli oranların belirgin şekilde gerisinde. Genel sohbet testlerinde de yanlış yanıt oranı %4,8 seviyesine inmiş görünüyor.

Güvenlik ve Dürüstlük

OpenAI, GPT-5’in aldatma eğiliminin düşük olduğunu ve zararlı kullanımla masum talepleri ayırt etme konusunda daha yetkin olduğunu belirtiyor. Bu sayede tehlikeli taleplere karşı daha kararlı red, makul isteklere karşı daha az gereksiz reddetme hedefleniyor.

Tüketici Deneyiminde Yenilikler

ChatGPT’ye Cynic, Robot, Listener ve Nerd olmak üzere dört yeni kişilik ekleniyor; bu profiller, talimat gerekmeksizin istenen üsluba uyum sağlıyor. GPT-5’in “düşünme” yetisi ise soruya bağlı olarak hız ile derinlik arasında otomatik denge kuruyor.

Geliştiriciler için API ve Fiyatlama

GPT-5, API’de üç boyutta sunuluyor: gpt-5, gpt-5-mini ve gpt-5-nano. Geliştiriciler yanıt uzunluğunu (verbosity) kontrol edebiliyor. Temel modelin maliyeti $1,25/M giriş token’ı ve $10/M çıkış token’ı olarak açıklanıyor; bu da daha erişilebilir bir eşik hedefliyor.

Açık ağırlık ve rekabet bağlamı

Lansman haftasında OpenAI, indirilebilir açık ağırlıklı gpt-oss modelini de yayınladı; önceki o3 ve o4-mini’ye benzer bir performans sunan bu modelin yanında, GPT-5 ise özellikle kodlama gibi alanlarda standardı yükseltmeyi hedefliyor. Yine de pek çok metrikte rakiplerle başa baş bir tablo var; gerçek farkı, geliştiricilerin ve kullanıcıların sahadaki deneyimi belirleyecek.

Cevap Yaz

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir