Anthropic uzun süredir beklenen ve aynı zamanda endişe yaratan Claude Mythos modelinin ilk halka açık sürümü olan Claude Fable 5’i yayınladı. Bu yeni modelde kullanıcıların siber güvenlik açıklarını istismar etmek veya biyolojik silahlar geliştirmek için kullanmasını önlemek amacıyla çeşitli koruma önlemleri alındı.
Öne çıkanlar
• Şirket ayrıca, halihazırda Claude Mythos Preview’a erişimi olan “küçük bir siber savunmacılar ve altyapı sağlayıcıları grubu” için daha güçlü bir model olan Claude Mythos 5’i de yayınlayacağını açıkladı.
• Anthropic, bu iki yeni modelin yazılım mühendisliği, finansal analiz gibi bilgiye dayalı işler ve “görsel” ile “uzun bağlam” gerektiren görevlerde üstün olduğunu iddia ediyor.
• Yapay zeka şirketi, daha gelişmiş model için ABD hükümetiyle birlikte çalışarak erişimi “kademeli olarak genişletmeyi” hedeflediğini ve bu modelin “dünyadaki herhangi bir modelden daha güçlü siber güvenlik yeteneklerine” sahip olduğunu belirtti.
• Claude Fable 5 ve Mythos 5’in fiyatı, milyon giriş tokenı başına 10 dolar ve milyon çıkış tokenı başına 25 dolar olaca. Bu, Anthropic’in şu anda mevcut en gelişmiş Claude Opus modellerinin yaklaşık iki katı ancak Claude Mythos Preview’ın sunulduğu fiyatın hala yarısından daha düşük.
Claude Fable’ın güvenlik önlemleri nasıl çalışacak?
Anthropic, Claude Fable’ın “zararlı bilgilere erişmek için modeli kırmaya” yönelik girişimler gibi kötüye kullanım durumlarını tespit eden yeni sistemlerle piyasaya sürüleceğini açıkladı. Şirketin “sınıflandırıcılar” olarak adlandırdığı bu sistemler, belirli konularla ilgili sorguları tespit ettikten sonra bunları Claude Opus’a yönlendirerek çalışıyor. Bu sınıflandırıcılar; Claude’un “otonom saldırı” için kullanılmasına yönelik girişimler de dahil olmak üzere siber güvenlik konularını ve biyolojik silah geliştirilmesine yol açabilecek belirli biyoloji ve kimya sorularını kapsayacak. Üçüncü sınıflandırıcı ise Anthropic’in “damıtma” olarak adlandırdığı, Claude kullanılarak rakip yapay zeka modelleri oluşturma girişimlerini hedefliyor.
Arka plan
Anthropic, yaklaşmakta olan modeli hakkında aylardır bilgiler paylaşıyordu. Yeni model ilk olarak nisan ayında duyurulmuş ancak güvenlik endişeleri nedeniyle halka açık olarak yayınlamaktan kaçınmıştı. Bunun yerine, siber güvenlik açıklarını tespit etmek amacıyla Apple, Microsoft ve Google gibi teknoloji şirketlerinden oluşan bir gruba Project Glasswing aracılığıyla bir sürüm sunmayı tercih etti. Anthropic, Mythos’u halka açık olarak, gizli şekilde halka arz başvurusu yaptıktan sadece biraz daha uzun bir süre sonra yayınladı. Şirketin bu yılın ilerleyen dönemlerinde halka açılmayı hedeflediği ve mayıs ayında gerçekleştirilen bir finansman turunun ardından şu anda 965 milyar dolar değerinde olduğu belirtildi.