Mythos Preview tüm AISI siber güvenlik test sahalarını başarıyla tamamlayarak
- Kaynak
- AI Security Institute
- Saat
- 21:03
- Ağırlık
- 95/100
AI Safety Institute (AISI) tarafından yapılan son değerlendirmeler, otonom yapay zeka siber yeteneklerinin hızlanan bir oranda geliştiğini ve öncü modellerin önceki performans eğilimlerini önemli ölçüde aştığını ortaya koyuyor. Güncel veriler, bu modellerin otonom olarak tamamlayabildiği siber görevlerin karmaşıklığının ve süresinin yaklaşık her dört ayda bir ikiye katlandığını gösteriyor.
Son dönemde geliştirilen Claude Mythos Preview ve GPT-5.5 modelleri, AISI'nin mevcut dar kapsamlı test setlerinin ölçüm sınırlarına ulaşacak kadar yüksek başarı oranları sergiledi. Otonom yetenekler açısından önemli bir dönüm noktasında, Claude Mythos Preview modelinin yeni bir sürümü enstitünün tüm siber menzillerini başarıyla tamamlayan ilk model oldu.