Nach Angaben eines US-Regierungsvertreters gegenüber AP wurden die Tests gemeinsam von Anthropic und US-Geheimdiensten durchgeführt. Dabei kam das Modell Mythos zum Einsatz, das in der Übung Schwachstellen in klassifizierten US-Regierungssystemen aufspürte. Der Vertreter sprach anonym, um über die Angelegenheit sprechen zu können.
Öffentlich war der Vorgang bereits am Rande einer Anhörung im Senatsausschuss für Banken, Wohnungsbau und städtische Angelegenheiten am 11. Juni angesprochen worden. Der demokratische Senator Mark Warner aus Virginia sagte dort: „Dieses Werkzeug drang in fast alle unsere klassifizierten Systeme ein, nicht in Wochen, sondern in Stunden.“ Er führte diese Information auf den Leiter der National Security Agency und des U.S. Cyber Command, General Joshua Rudd, zurück.
Die NSA wollte den Vorgang laut AP auf Anfrage per E-Mail nicht kommentieren. Auch ein Sprecher von Anthropic lehnte eine Stellungnahme ab.
Die Tests fanden laut dem Regierungsvertreter im Rahmen von Project Glasswing statt. Mit dieser Initiative will Anthropic große Technologieunternehmen und andere Firmen zusammenbringen, um kritische Software vor „schweren“ Auswirkungen zu schützen, die das Mythos-Modell für öffentliche Sicherheit, nationale Sicherheit und die Wirtschaft haben könnte.
Parallel dazu verschärft sich der Konflikt zwischen dem kalifornischen Unternehmen und der Trump-Regierung. Dem Bericht zufolge hat Anthropic Bedenken geäußert, wie das US-Militär seine KI einsetzen würde. Die Regierung wiederum hat den Einsatz einiger Anthropic-Modelle eingeschränkt.
So erließ die Regierung in diesem Monat eine Anweisung, nach der Anthropic verhindern muss, dass ausländische Staatsangehörige die neuesten KI-Modelle des Unternehmens nutzen. Genannt werden Fable 5 und Mythos 5. Anthropic veröffentlichte Fable in diesem Monat breit. Dabei handelt es sich laut Bericht um eine begrenzte Variante des weiterentwickelten Mythos, zu dem das Unternehmen wegen Befürchtungen im Bereich Cybersicherheit den Zugang stark beschränkt hat.
Die Anweisung folgte zehn Tage nach einer von Präsident Donald Trump unterzeichneten Executive Order. Sie soll einen Rahmen schaffen, mit dem die Bundesregierung die Risiken für die nationale Sicherheit durch die fortschrittlichsten KI-Systeme vor ihrer öffentlichen Freigabe bis zu einen Monat lang prüfen kann. Laut Anordnung ist die Teilnahme der KI-Entwickler freiwillig.
Anthropic erklärte, es habe die betroffenen Modelle für alle Kunden deaktiviert, um der Anweisung der Regierung nachzukommen. Zugleich teilte das Unternehmen mit, es halte die Schritte der Regierung nicht für gerechtfertigt durch das von ihm gemeldete potenzielle Sicherheitsproblem.
Zusätzlichen Druck macht ein Schreiben einer Gruppe von Cybersicherheitsmanagern an die Trump-Regierung. Darin fordern sie, die Anweisung zurückzunehmen, weil sie US-Gegnern mehr helfen könnte, als sie ihnen schade. Mehr als 100 Cybersicherheitsexperten und Führungskräfte, unter anderem von Adobe und Nvidia, schrieben an die Regierung, die Mythos-Modelle von Anthropic seien „ziemlich gut“ darin, Softwarefehler zu finden und Exploits zu bewaffnen, aber sie seien „nicht einzigartig gut bei diesen Aufgaben“.
Viele Unterzeichner des Briefs erklärten dem Bericht zufolge, sie nutzten regelmäßig andere Grundlagen- und Open-Source-Modelle für Sicherheitsaudits und Schulungen. In dem Schreiben heißt es außerdem, es sei gefährlich, den besten Fähigkeiten zur Cyberabwehr „ohne guten Grund“ die Grundlage zu entziehen, während Amerikas Gegner rasch vorankämen.
