Oesnada

Gün tek bir çizgiye indi.

Zaman çizgisini bükecek ağırlığı olan haberler burada kalır.

Aktif Sinyal

Mythos Preview tüm AISI siber güvenlik test sahalarını başarıyla tamamlayarak

Kaynak: AI Security Institute
Saat: 21:03
Ağırlık: 95/100

Sesli Özet

0:00 / 0:00

AI Safety Institute (AISI) tarafından yapılan son değerlendirmeler, otonom yapay zeka siber yeteneklerinin hızlanan bir oranda geliştiğini ve öncü modellerin önceki performans eğilimlerini önemli ölçüde aştığını ortaya koyuyor. Güncel veriler, bu modellerin otonom olarak tamamlayabildiği siber görevlerin karmaşıklığının ve süresinin yaklaşık her dört ayda bir ikiye katlandığını gösteriyor.

Son dönemde geliştirilen Claude Mythos Preview ve GPT-5.5 modelleri, AISI'nin mevcut dar kapsamlı test setlerinin ölçüm sınırlarına ulaşacak kadar yüksek başarı oranları sergiledi. Otonom yetenekler açısından önemli bir dönüm noktasında, Claude Mythos Preview modelinin yeni bir sürümü enstitünün tüm siber menzillerini başarıyla tamamlayan ilk model oldu.

Kaynağa Git