Anthropic, Claude Mythos Preview adlı yeni modelini duyurduktan sonra teknoloji dünyasında ciddi bir yankı oluştu. Şirket, bu modelin özellikle büyük kod tabanlarında gizli kalmış güvenlik açıklarını ortaya çıkarma konusunda şimdiye kadarki en güçlü sistem olduğunu iddia ediyor.
Daha da dikkat çekici olan ise modelin yalnızca açıkları bulmakla kalmayıp, bunları istismar edebilecek düzeyde olması. Bu durum, modelin potansiyel olarak hem savunma hem de saldırı amaçlı kullanılabileceği anlamına geliyor.
Claude Mythos tam olarak ne yapabiliyor?
Claude Mythos, klasik yapay zekâ modellerinden farklı olarak özellikle siber güvenlik senaryolarına odaklanıyor. Büyük ölçekli yazılım projelerini analiz edebiliyor ve uzmanların bile gözden kaçırabileceği açıkları tespit edebiliyor.
Modelin öne çıkan yetenekleri:
- Büyük kod tabanlarını derinlemesine analiz edebilme
- Daha önce keşfedilmemiş güvenlik açıklarını bulma
- Bulduğu açıkları istismar edebilecek senaryolar oluşturma
- Farklı işletim sistemleri ve tarayıcılar üzerinde çalışabilme
Anthropic’e göre model, halihazırda birçok büyük sistemde kritik güvenlik açıkları tespit etti.
Performans testlerinde dikkat çeken sonuçlar
Claude Mythos’un performansı da en az yetenekleri kadar dikkat çekici. Model, birçok farklı benchmark testinde üst sıralarda yer aldı.
Özellikle öne çıkan sonuçlar:
| Test / Benchmark | Sonuç |
|---|---|
| Cybench (siber güvenlik) | %100 (ilk model) |
| SWE-bench | Lider |
| BrowseComp | Lider |
| ABD Matematik Olimpiyatı | Üst düzey performans |
Cybench testinde %100 skor elde etmesi, modelin siber güvenlik görevlerinde ne kadar ileri olduğunu gösteriyor.
Neden herkese açık değil?
Anthropic’in en tartışmalı kararı ise bu modeli kamuya açmamak oldu. Şirket, modelin “herhangi bir sisteme sızabilecek” kapasitede olduğunu belirterek erişimi ciddi şekilde sınırlandırdı.
Şu anda model yalnızca belirli ortaklara sunulmuş durumda. Bu ortaklar arasında:
- Amazon Web Services (AWS)
- Apple
- Microsoft
- Nvidia
- Cisco
- CrowdStrike
gibi teknoloji devleri yer alıyor.
Bu erişim de yalnızca savunma ve güvenlik testleriyle sınırlı tutuluyor.
Güvenlik mi risk mi?
Claude Mythos, siber güvenlik alanında devrim yaratabilecek bir araç olarak görülüyor. Ancak aynı zamanda yanlış ellerde ciddi tehdit oluşturabilecek bir teknoloji olarak da değerlendiriliyor.
Uzmanlara göre asıl tartışma şu noktada yoğunlaşıyor: Bu kadar güçlü bir yapay zekâ yalnızca savunma için mi kullanılacak, yoksa gelecekte yeni siber saldırıların kapısını mı aralayacak?
Anthropic’in bu modeli kontrol altında tutma kararı, şimdilik bu riskleri sınırlamayı amaçlıyor.