Bugün: Nisan 5, 2025
Nisan 4, 2025
1 dk okuma

Şimdiye Kadarki En İyi Yapay Zekâ Modeli Araştırıldı: Şampiyon Ne ChatGPT Ne DeepSeek…

Yapay zekâ sektörü her gün biraz daha kızışıyorken yapılan testler, dünyanın en iyi yapay zekâ modelinin hangisi olduğunu gözler önüne serdi. Elde edilen bulgular, aslında çok da şaşırtıcı değildi.

Google’ın daha çok yeni yapay zekâ modeli Gemini 2.5 Pro, girdiği testlerde diğer modellerden daha iyi sonuçlar elde etti. Üstelik Google Gemini 2.5 Pro ile diğer modeller arasındaki performans farkı gerçekten etkileyiciydi. Model, bazı testlerde rakiplerinin gerisinde kalmıştı ancak buradaki puan farkı fazla anlamlı değildi.

Gemini 2.5 Pro, farklı testlerde de daha iyi sonuçlar veriyor!

Google Gemini 2.5 Pro, tek bir testte başarılı değildi. Matematik özelinde bir test olan MathArena’da test edilen model, rakiplerinden çok daha iyi performans gösterdi. Bu modelin puanı yüzde 24,4 olarak kayıtlara geçerken OpenAI, Anthropic ve DeepSeek gibi firmaların piyasaya sürdüğü yapay zekâ modelleri, yüzde 5’i geçemediler. Öte yandan; yapay zekânın bir alanda insanları ne zaman geçtiğini ölçen Humanity’s Last Exam testinde de Gemini 2.5 Pro, rakiplerini geride bırakmıştı.

Tabii bu demek değil ki Gemini 2.5 Pro, tüm alanlarda en iyi yapay zekâ modeli. Kodlama özelinde bir test olan LiveCodeBench’e giren model, kıyaslamalarda yüzde 70,4 puan aldı. OpenAI’ın o3-mini modeli aynı testte yüzde 74,1 puan almıştı. Yine yazılımla ilgili bir test olan SWE-bench’te yüzde 63,8 puan alan Gemini 2.5 Pro, yüzde 70,3 puan alan Claude 3.7 Sonnet’in gerisinde kaldı.

Önceki

Onlyfans’a Toplu Dava: Kullanillar, Aldatalilikinaze Tez Ediyor

Sonraki

Merkez Bankası rezervleri son iki haftada 14,6 milyar dolar azaldı

Son gönderi Blog

Don't Miss

ChatGPT’yle Oluşturulan Sahte Pasaport, Kimlik Doğrulama Sistemlerini Kolayca Geçebildi

Bir kişi, ChatGPT'yi kullanarak sahte pasaport oluşturdu. Pasaport, kimlik doğrulama

Midjourney, Çok Daha Kaliteli ve Gerçekçi Görseller Üretebilen Yeni Yapay Zeka Modeli V7’yi Duyurdu

Midjourney, 1 yılın ardından yepyeni bir yapay zekâ modeli tanıttı.