Bugün: Nisan 18, 2025
Ocak 24, 2025
1 dk okuma

En İyi Yapay Zekâ Modellerinin Bile Tam Not Alamadığı Yeni Bir Performans Testi Oluşturuldu

Yapay zekâ modellerine yönelik yeni bir performans testi oluşturuldu. Yapay zekâ sektörünün kâr amacı gütmeyen kuruluşlarından Center for AI Safety (CAIS) ile Scale AI isimli şirket tarafından geliştirilen bu performans testi, en iyi yapay zekâ modellerini bile zorlayan türden.

“Humanity’s Last Exam” olarak isimlendirilen yeni performans testi, pek çok kategoride zorlayıcı sorulara ev sahipliği yapıyor. Yapılan açıklamalara göre bu testte matematik, beşeri bilimler ve doğa bilimleri gibi onlarca konuda, 3.000 civarı soru bulunuyor. Geliştiriciler, testin gerçekten belirleyici olması için grafikler, diyagramlar ve görseller kullanmayı da ihmal etmediler.

En iyi yapay zekâ modeli bile tüm soruları çözemiyor

Humanity’s Last Exam, gerçekten zorlayıcı bir performans testi olacak gibi görünüyor. Zira yapılan çalışmalara göre piyasadaki amiral gemisi yapay zekâ modelleri, bu performans testinde yüzde 100 başarıya ulaşamadılar. Hatta 2021 yılında yayımlanan matematik odaklı testlerde erken aşamadaki yapay zekâ modelleri, 100 üzerinden 10 puan bile alamamışlardı.

Humanity’s Last Exam’in ortaya çıkarılması için 50’den fazla ülkede 1.000 kadar kişiden destek alındı. Projeye destek olan isimler araştırmacılar ve profesörlerden oluşuyordu. Hâl böyle olunca bu performans testi, gelecekte sektör için önemli bir kıstas olabilir gibi görünüyor. Bu testte sorulan bazı örnek soruları incelemek isterseniz buradaki bağlantıyı kullanabilirsiniz.

Bir yanıt yazın

Your email address will not be published.

Önceki

Prof. Dr. Hakan Kara’dan dikkat çeken ‘faiz’ çıkışı: Enflasyon ne olursa olsun…

Sonraki

Fransa’da hükümet krizine yol açan 2025 bütçesi kabul edildi

Son gönderi Blog

Don't Miss

Trump: Çinli yetkililerle tarifeleri görüştük

ABD Başkanı Donald Trump, tarife müzakereleri kapsamında Çin'le görüştüklerini belirtirken

Trump idaresinden DeepSeek’e kısıtlama sinyali

ABD, yapay zeka alanındaki üstünlüğünü koruma hedefi doğrultusunda, Çin merkezli