Anthropic hat am Mittwoch den globalen Zugang zu Fable 5 wieder freigeschaltet. Die Abschaltung hatte etwa drei Wochen angedauert, nachdem die US-Regierung Exportkontrollen verhängt hatte. In einem Update vom Dienstag erklärte das Unternehmen, die Kontrollen seien nach mehreren Vereinbarungen mit der Regierung aufgehoben worden.

Auch die Exportbeschränkungen für das leistungsstärkere Cybersicherheitsmodell Mythos 5 wurden laut Anthropic zum 30. Juni vollständig aufgehoben. Der Zugang zu diesem Modell bleibt jedoch auf überprüfte US-Organisationen im Rahmen von Project Glasswing beschränkt, einem Programm mit kontrolliertem Zugang für Verteidiger kritischer Infrastrukturen. Anthropic verhandelt nach eigenen Angaben weiter über einen breiteren nationalen und internationalen Zugang über Glasswing.

Nach Darstellung von Anthropic wurde die ursprüngliche Abschaltung durch eine „Jailbreak“-Technik ausgelöst, die in einem Forschungsbericht von Amazon behandelt wurde. Katie Moussouris, Gründerin von Luta Security, die Anthropic mit der Bewertung der Arbeit beauftragte, beschrieb die Methode später detailliert. Demnach gaben Forscher Fable 5 Open-Source-Code mit öffentlich bekannten Schwachstellen und absichtlich eingebauten Fehlern und forderten das Modell auf, diesen Code zu reparieren. Die Ausgaben des Modells seien anschließend manuell über mehrere Schritte hinweg zu Skripten zusammengesetzt worden, die Patches testen.

Moussouris widersprach der Einordnung als Umgehung von Schutzmechanismen. „Das ist keine Umgehung einer Schutzvorrichtung“, schrieb sie. Vielmehr sei es „das Wertvollste, was ein KI-Modell für die defensive Sicherheit tun kann: den Such-, Reparatur- und Testkreislauf auszuführen, den Verteidiger jeden Tag nutzen“. Ihr Fazit lautete, dass sich diese grundlegende Fähigkeit nicht entfernen lasse, ohne den Nutzen des Modells für legitime Sicherheitsarbeit zu verschlechtern.

Anthropic erklärte weiter, eigene Tests hätten bestätigt, dass dieselbe Technik auch gegen andere Modelle funktioniere, darunter OpenAIs GPT-5.5 und das chinesische Modell Kimi K2.7. Keines dieser Modelle sei vergleichbaren Exportbeschränkungen unterworfen worden. Nach Angaben des Unternehmens legte die Technik keine Fähigkeit offen, die ausschließlich seinen Frontier-Modellen vorbehalten wäre.

Im Zuge der Verhandlungen über die Wiederfreigabe von Fable 5 trainierte Anthropic nach eigenen Angaben einen neuen Sicherheitsklassifikator, der die konkrete Technik in mehr als 99 Prozent der Fälle blockiert. Forscher des Center for AI Standards and Innovation im Handelsministerium testeten sowohl die ursprünglichen als auch die aktualisierten Schutzmaßnahmen und unterstützten das Ergebnis.

Zusätzlich sagte Anthropic einen erweiterten Vorabzugang für staatliche Prüfer zu, damit diese Frontier-Modelle vor einer breiten Freigabe testen können. Hinzu kommen eine schnelle Offenlegung erheblicher Jailbreaks, eigene Mitarbeiter und Rechenkapazität für gemeinsame Forschung sowie die Teilnahme an einem gemeinsamen freiwilligen Sicherheitsstandard mehrerer Anbieter von Frontier-Modellen. Außerdem eröffnete das Unternehmen bei HackerOne ein Bug-Bounty-Programm für Cyber-Jailbreak-Einreichungen.

Gemeinsam mit seinen Glasswing-Partnern Amazon, Microsoft und Google arbeitet Anthropic nach eigenen Angaben an einem Branchenrahmen, der die Schwere von Jailbreaks anhand von vier Kriterien bewerten soll: Fähigkeitsgewinn gegenüber bestehenden Werkzeugen, Breite der betroffenen Aufgaben, Einfachheit der Bewaffnung und Auffindbarkeit.

Mehr als 100 Cybersicherheitsfachleute unterzeichneten zudem einen offenen Brief, organisiert vom früheren Facebook-Sicherheitschef Alex Stamos und adressiert an Handelsminister Howard Lutnick sowie den National Cyber Director Sean Cairncross. Darin warnten sie, die Exportkontrollen könnten mehr schaden als nützen. „Die chinesischen Open-Weight-Modelle liegen nur Monate hinter den besten amerikanischen Modellen, und das sind die Modelle, die wir kennen“, heißt es in dem Schreiben. „Den Verteidigern die besten Fähigkeiten ohne guten Grund zu entziehen, während unsere Gegner rasch aufholen, ist gefährlich.“ Zu den Unterzeichnern zählten Führungskräfte von Nvidia, Adobe, Zoom, Google und Sophos.

Der Erlass fiel vor dem Hintergrund angespannter Beziehungen zwischen Anthropic und der Trump-Regierung. Im Februar hatte Verteidigungsminister Pete Hegseth Anthropic nach gescheiterten Vertragsverhandlungen über den militärischen Einsatz von Claude als „Lieferkettenrisiko“ eingestuft. CNBC berichtete zudem, Anthropic-Mitgründer Tom Brown habe die Verhandlungen mit der Regierung von CEO Dario Amodei übernommen. Dem Bericht zufolge war Amodei wegen seiner öffentlichen Positionen zur KI-Sicherheit und seiner Unterstützung für Kamala Harris bei der Wahl 2024 politisch ins Visier der Regierung geraten. Lutnicks Schreiben zur formellen Aufhebung des Verbots sei Berichten zufolge an Brown statt an den Vorstandschef adressiert worden.