Anthropic yapay zeka hizalamasını iyileştirmek için ara eğitim aşaması ekliyor
- Kaynak
- Anthropic
- Saat
- 2:24
- Ağırlık
- 94/100
Anthropic, yapay zeka modellerinin uyumluluk ilkelerini genelleştirme yeteneğini artırmak amacıyla Model Spec Midtraining (MSM) adını verdiği yeni bir eğitim aşaması tanıttı. İlk ön eğitim ile son uyumluluk ince ayar aşamaları arasında konumlandırılan MSM, modellerin yapay zekanın davranışlarını yönetmesi amaçlanan "Model Spec" veya anayasayı tartışan sentetik dokümanlardan oluşan bir külliyat üzerinde eğitilmesini içeriyor.
Bu aşama, modele talimatlarının ardındaki temel mantığı öğreterek, modelin belirli davranış kalıplarını sadece ezberlemek yerine yönergelerinin prensiplerini kavramasına yardımcı olmayı hedefliyor. Araştırmalar, MSM'nin geleneksel ince ayar yöntemlerinin genellikle yetersiz kaldığı karmaşık ve kapsam dışı senaryolarda model performansını önemli ölçüde iyileştirdiğini gösteriyor.