Das Spannungsfeld zwischen Innovation und Sicherheit wird bei Claude Mythos besonders deutlich. Anthropic betont, dass die Exploit-Schreib-Fähigkeiten eine unbeabsichtigte Konsequenz verbesserter Code- und Reasoning-Capabilities sind. Doch genau diese Doppelnutzung – die gleichen Verbesserungen helfen sowohl beim Patchen als auch beim Exploiten von Sicherheitslücken – birgt erhebliche Risiken.
Um diese zu minimieren, startete Anthropic parallel zu Mythos die Initiative “Project Glasswing” in Zusammenarbeit mit Tech-Giganten wie Apple, AWS, Microsoft, Palo Alto Networks und CrowdStrike. Über 40 Organisationen erhalten Zugang zu Mythos Preview, um ihre Systeme zu sichern. Anthropic investiert 100 Millionen Dollar in Nutzungsguthaben und spendet weitere 4 Millionen Dollar an Open-Source-Sicherheitsorganisationen.
Doch Sicherheitsexperten bleiben skeptisch. Erik Nost von Forrester warnt: “Es ist ein Wettrennen für Verteidiger, um Patches einzuspielen, bevor andere KI-Systeme in falschen Händen diese Zero-Days entdecken und schnell Exploits schreiben.” Julian Totzek-Hallhuber von Veracode geht noch weiter – er empfiehlt Unternehmen, davon auszugehen, dass die Fähigkeit proliferieren wird. Die Konsequenz: Mehr Investitionen in Anomalie-Erkennung, Zero-Trust-Architekturen und aggressive Patch-Zyklen.
Ein grundlegendes Problem bleibt ungelöst: Melissa Ruzzi von AppOmni spricht eine unbequeme Wahrheit aus – niemand kann verhindern, dass Cyberkriminelle Zugang zu solchen Tools bekommen. Man kann es ihnen nur schwerer machen.
Zusätzlich kritisieren Experten die beschränkte Verfügbarkeit von Mythos. Ohne öffentlichen Zugang können unabhängige Forscher die Behauptungen Anthropics nicht überprüfen. Totzek-Hallhuber warnt: “Anthropic kontrolliert sowohl das Modell als auch die Narrative. Gesunde Skepsis ist angebracht.” Anthropic antwortet bislang nicht auf Fragen zu Fehlerquoten und False-Positive-Raten – ein Informationsvakuum, das für Kritiker problematisch ist.
