KI-SicherheitCyberkriminalitätSchwachstellen

Anthropic bereitet Rollout von Mythos-Modell vor: KI-gestützte Cyberangriffe als Sicherheitsrisiko

Anthropic bereitet Rollout von Mythos-Modell vor: KI-gestützte Cyberangriffe als Sicherheitsrisiko
Zusammenfassung

Der KI-Sicherheitsforscher Anthropic arbeitet offenbar an der öffentlichen Freigabe von „Mythos", einem fortschrittlichen KI-Modell, das im April als limitierte Vorschau angekündigt wurde. Das Modell zeigt außergewöhnliche Fähigkeiten bei der Entwicklung von Cybersecurity-Aufgaben und kann automatisch professionelle Cyberangriffe generieren – eine Capability, die Anthropic selbst als erhebliches Risiko für kritische digitale Infrastruktur weltweit einstuft. Das Unternehmen hatte eine öffentliche Freigabe bewusst verzögert, um zunächst robuste Schutzmechanismen zu entwickeln. Nun deuten mehrere Indizien darauf hin, dass diese Schutzmaßnahmen implementiert wurden: Nutzer entdeckten kurzzeitig Verweise auf das Mythos-Modell in Claude Code und Claude Security. Im Rahmen des „Glasswing"-Projekts arbeitet Anthropic mit etwa 50 Organisationen zusammen und hat bereits über 10.000 kritische Sicherheitslücken identifiziert. Für deutsche Nutzer, Unternehmen und Behörden könnte die öffentliche Verfügbarkeit dieses Modells sowohl Chancen als auch Risiken mit sich bringen – es könnten schneller Sicherheitslücken gefunden werden, aber auch Angreifer könnten davon profitieren, falls die Schutzmaßnahmen unzureichend sind.

Anthropic kündigte das Mythos-Modell bereits im April an und beschrieb es als Durchbruch in der Computer-Sicherheit mit bemerkenswert fortgeschrittenen Fähigkeiten. Die Verbesserungen des Modells in Code-Analyse und Autonomie übertreffen deutlich die aktuelle Flaggschiff-Version Opus 4.7. Doch während Fortschritte im Bereich Code-Generierung bei KI-Modellen üblich sind, unterscheidet sich Mythos fundamental: Das System kann eigenständig und automatisiert funktionsfähige Cyberangriffe auf professionellem Niveau durchführen.

Anthropics eigene Warnung ist deutlich: “Der Vorteil wird der Seite gehören, die diese Tools am besten nutzen kann. Kurzfristig könnten das Angreifer sein, wenn Frontier Labs nicht vorsichtig mit Veröffentlichungen umgehen. Langfristig werden es Verteidiger sein, die diese Modelle effizienter nutzen, um Bugs vor dem Launch zu beheben.” Diese Einschätzung erklärt, warum das Unternehmen die öffentliche Freigabe bisher verzögert hatte.

Aktuell gibt es erste Hinweise auf einen unmittelbar bevorstehenden Rollout: Nutzer haben vorübergehend Schalter bemerkt, um Mythos in Claude Code und Claude Security zu aktivieren, bevor diese entfernt wurden. Die interne Bezeichnung lautet “claude-mythos-1-preview”. Dies deutet darauf hin, dass Anthropic ein stabiles Guardrail-System entwickelt hat – eine kritische Sicherheitsarchitektur, die Missbrauch verhindern soll.

Zu diesem Schluss passt Anthropics paralleles Projekt “Glaswing”: Eine Kooperation mit bis zu 50 Partnern-Organisationen, um kritische Software vor KI-gestützten Exploits zu schützen. Das noch nicht veröffentlichte Mythos-Modell identifizierte in seinem ersten Monat bereits 10.000 kritische und hochgradige Sicherheitslücken – ein Beleg für seine Effektivität und für Anthropics Vorsicht bei der Freigabe.

Für deutsche Unternehmen und Behörden sind die Implikationen erheblich: Eine automatisierte Schwachstellenerkennung dieser Qualität könnte, wenn missbraucht, zu Massenangriffen auf verbreitete Systeme führen. Dies betrifft direkt BSI-Standards und DSGVO-Meldepflichten. Anthropic signalisiert Verantwortung durch kontrolierte Forschungspartnerschaften, doch die kommende Veröffentlichung erfordert strikte Sicherheitsmaßnahmen und Monitoring.