Meta’nın AI Sıralama Başarısı Tartışma Yarattı

10 Nisan 2025
10 Nisan 2025
4dk okuma
Yorum Yok
Llama 4 LMArena Meta yapay zeka

Meta, Llama 4 çatısı altında geliştirdiği iki yeni yapay zeka modelini geçtiğimiz hafta sonunda tanıttı: Scout ve Maverick. Şirket, özellikle Maverick modelinin ChatGPT-4o ve Gemini 2.0 Flash gibi rakiplerine karşı üstünlük sağladığını öne sürdü. Ancak kısa süre sonra ortaya çıkan detaylar, bu başarıya gölge düşürdü. Çünkü testlerde kullanılan modelin, kullanıcılara sunulacak versiyonla aynı olmadığı ortaya çıktı.

meta chatgpt rakibi ai llama 4 behemoth maverick scout nasil calisir

Yarışta Öne Geçti, Ancak Hangi Modelle?

Maverick, yapay zekaların karşılaştırıldığı LMArena platformunda kısa sürede ikinci sıraya yerleşerek dikkatleri üzerine çekti. Platform, kullanıcıların yapay zeka yanıtlarını karşılaştırarak oylama yaptığı bir arena işlevi görüyor. Meta’nın açıklamasına göre Maverick modeli 1417 ELO puanına ulaşarak ChatGPT-4o’yu geride bırakmış, sadece Gemini 2.5 Pro’nun bir adım gerisinde kalmıştı. Ancak işin aslı daha sonra anlaşıldı.

Testlerde kullanılan modelin aslında “Llama-4-Maverick-03-26-Experimental” adlı özel bir sürüm olduğu ve bu versiyonun kamuya açık versiyonlardan farklı olarak insan beğenisine göre özel olarak optimize edildiği belirtildi. Yani, Meta’nın kamuoyuna sunduğu model ile testlerde kullanılan model birebir aynı değildi.

LMArena Politikasını Değiştirdi

Söz konusu durum ortaya çıkınca LMArena platformu, Meta’nın şeffaf davranmadığını vurgulayarak yeni bir politika değişikliğine gitti. Platformdan yapılan açıklamada, “Meta’nın politikalarımızı yorumlayışı, beklentilerimizle örtüşmedi. Bu konuda daha açık olmaları gerekiyordu,” denildi.

Meta ise bu konuda kuralları ihlal etmediğini savunurken, daha net bir iletişim kurması gerektiğini kabul etti. Şirket sözcüsü yaptığı açıklamada, “Artık açık kaynak sürümümüzü yayınladık. Geliştiricilerin Llama 4’ü kendi kullanım alanlarına göre nasıl özelleştireceklerini hep birlikte göreceğiz,” ifadelerini kullandı.

“Bu Modeli Kullanamıyoruz, Sıralama Ne İşe Yarar?”

Yapay zeka alanında bağımsız bir araştırmacı olan Simon Willison, yaşananları şöyle değerlendirdi:

“Llama 4 duyurulup ikinci sıraya yerleştiğinde gerçekten etkilenmiştim. Ancak detayları tam okumadığım için kendime kızıyorum. Sonuç olarak yüksek puan alan bu modeli kullanamıyoruz. Bu da o sıralamayı benim için değersiz kılıyor.”

Öte yandan Meta’nın bazı test setleriyle özel olarak eğitildiğine dair söylentiler de gündeme geldi. Ancak Meta’nın Yapay Zeka Başkan Yardımcısı Ahman Al-Dahle bu iddiaları kesin bir dille reddetti:

“Test setleriyle eğitim yaptığımız yönündeki iddialar tamamen asılsız.”

Yayın Tarihi de Sorgulandı

Maverick modelinin pazar günü sessizce yayınlanması da bazı kullanıcılar tarafından ilginç bulundu. Meta CEO’su Mark Zuckerberg ise bu eleştiriye kısa bir yanıt verdi:

“Model o gün hazır oldu.”

Rekabet Kızışırken Güven Tartışması

Meta, Llama 4 serisini duyurmak için uzun süre bekledi ancak piyasadaki rekabetin geldiği noktada artık daha agresif adımlar atmak kaçınılmaz görünüyordu. Yine de bu son olay, yapay zeka yarışında sadece güçlü sonuçlar değil, şeffaflık ve kullanıcıya sunulan gerçek değer konularında da dikkatli olunması gerektiğini bir kez daha gösterdi.

Meta’nın bu modeli sıralamalarda nasıl kullandığı ve kullanıcıya sunduğu versiyon arasındaki fark, yapay zeka dünyasında adil rekabet tartışmalarını yeniden alevlendirdi.