Anthropic bereitet offenbar öffentliche Einführung des restriktierten Modells „Mythos" vor

Zusammenfassung

Anthropic scheint die öffentliche Freigabe von „Mythos" vorzubereiten, einem Modell, das im April angekündigt und zugleich als sicherheitskritisch eingestuft wurde. Nach Angaben des Unternehmens handelt es sich um ein neues Spitzenmodell mit auffällig fortgeschrittenen Fähigkeiten bei Aufgaben der Computersicherheit. Mythos zeige deutliche Fortschritte beim Verständnis von Code und bei autonomem Arbeiten – weit über das aktuelle Flaggschiff Opus 4.7 hinaus. Besonders heikel: Laut Anthropic kann das Modell automatisiert funktionsfähige Cyberangriffe auf hohem professionellem Niveau entwickeln. Das Unternehmen warnte, eine Veröffentlichung berge ein erhebliches Risiko für die globale digitale Infrastruktur. Aus Sorge, Angreifer könnten eine große Zahl ungepatchter Schwachstellen in verbreiteten Anwendungen wie Firefox ausnutzen, verzichtete Anthropic zunächst auf eine öffentliche Freigabe – bis ein leistungsfähiges Schutzsystem bereitstehe. Inzwischen verweisen Claude Code und Claude Security auf das Modell, und einige Nutzer entdeckten kurzzeitig einen Schalter zur Aktivierung von Mythos in der öffentlichen Version von Claude Code, bevor dieser wieder offline genommen wurde. Das deutet darauf hin, dass die Schutzmechanismen womöglich entwickelt sind und die Einführung näher rückt.

Anthropic stellte Mythos nach eigenen Angaben am 7. April in einer frühen Vorschau vor und bezeichnete es als neues Frontier-Modell mit bemerkenswerten Fähigkeiten im Bereich der Computersicherheit. Fortschritte beim Programmieren seien bei KI-Modellen zwar nichts Neues, doch im Fall von Mythos stellte das Unternehmen fest, dass das Modell selbstständig funktionsfähige Cyberangriffe auf professionellem Niveau entwickeln kann.

Anthropic ordnete die Lage klar zu: „Der Vorteil wird der Seite gehören, die das Meiste aus diesen Werkzeugen herausholt." Kurzfristig könnten das die Angreifer sein, falls führende Labore beim Veröffentlichen solcher Modelle nicht vorsichtig vorgehen. Langfristig erwartet das Unternehmen jedoch, dass die Verteidiger im Vorteil sein werden, weil sie Ressourcen gezielter einsetzen und mit diesen Modellen Fehler beheben können, bevor neuer Code überhaupt ausgeliefert wird.

Hinweise auf eine bevorstehende Freigabe verdichten sich. In Claude Code und Claude Security tauchten Verweise auf das Modell auf, das intern claude-mythos-1-preview heißt. Einige Nutzer bemerkten kurzzeitig einen Schalter zur Aktivierung in der öffentlichen Version von Claude Code, bevor er entfernt wurde; auch in Claude Security erschien das Modell vorübergehend. Damit gilt als bestätigt, dass Anthropic die öffentliche Einführung vorbereitet. Offen bleibt, ob Mythos in allen Abostufen verfügbar sein wird.

Parallel bestätigte Anthropic ein neues Vorhaben namens „Glasswing", bei dem das Unternehmen mit anderen Firmen zusammenarbeitet, um besonders kritische Software vor möglichen KI-gestützten Angriffen zu schützen. Die Initiative nutzt die noch nicht veröffentlichte Claude Mythos Preview und half nach Unternehmensangaben bereits bis zu 50 Partnerorganisationen.

Den Verzicht auf eine schnelle Veröffentlichung erklärt eine Zahl: Allein im ersten Monat deckte Mythos laut Anthropic 10.000 Schwachstellen mit hohem oder kritischem Schweregrad auf. Aus diesem Grund hielt das Unternehmen die öffentliche Freigabe zurück, bis ein belastbares Schutzsystem vorlag.

Aktuell bietet Anthropic die Modelle Claude Opus 4.7, Opus 4.6, Opus 4.5, Sonnet 4.6 und Haiku 5.5 an. Mythos wäre eine Ergänzung dieser Reihe – mit dem ausdrücklichen Hinweis des Anbieters, dass das Modell erhebliche Sicherheitsrisiken für private wie öffentliche Software mit sich bringt.

Anthropic bereitet offenbar öffentliche Einführung des restriktierten Modells „Mythos" vor

Ähnliche Artikel

Neueste Artikel