Project Glasswing: KI findet die Schwachstellen schneller, als sie gepatcht werden

Zusammenfassung

Anthropic hat kürzlich Project Glasswing vorgestellt – ein KI-Modell, das Software-Schwachstellen so wirksam aufspürt, dass das Unternehmen den ungewöhnlichen Schritt ging, die öffentliche Freigabe zu verschieben. Stattdessen erhielten Apple, Microsoft, Google, Amazon und ein Bündnis weiterer Beteiligter Zugang, um Fehler zu finden und zu beheben, bevor Angreifer sie ausnutzen. Das Modell Mythos Preview, das zu Project Glasswing führte, entdeckte Schwachstellen in jedem großen Betriebssystem und Browser. Einige dieser Fehler hatten jahrzehntelange menschliche Audits, aggressives Fuzzing und die Prüfung durch die Open-Source-Gemeinschaft überstanden. Eine Lücke steckte seit 27 Jahren in OpenBSD, das vielfach als eines der sichersten Betriebssysteme der Welt gilt. Der entscheidende Unterschied liegt nicht im Finden, sondern im Beheben: Weniger als 1 Prozent der von Mythos gefundenen Schwachstellen wurden tatsächlich gepatcht. Die leistungsfähigste je gebaute Maschine zum Aufspüren von Schwachstellen lief gegen die kritischste Software der Welt – und das Ökosystem konnte die schiere Menge der Ergebnisse nicht verarbeiten. Damit rückt ein strukturelles Problem in den Mittelpunkt, um das die Branche seit Jahren kreist.

Bemerkenswert ist, wie scharf Mythos die bisherige Grenze autonomer Angriffstechnik verschiebt. Anthropics vorheriges Spitzenmodell Claude Opus 4.6 scheiterte bei der eigenständigen Entwicklung von Exploits nahezu vollständig. Mythos dagegen erreichte in der JavaScript-Shell von Firefox eine Erfolgsquote von 72,4 Prozent. Das ist keine theoretische Prognose für die nächsten drei bis fünf Jahre, sondern eine bevorstehende ingenieurtechnische Realität.

Die zentrale Diskrepanz zeigt sich im Tempo. Verteidiger arbeiten im Kalenderrhythmus; ein vollständiger Zyklus dauert im günstigsten Fall etwa vier Tage. Angreifer, die zunehmend an jeder Stelle ihrer Operationen auf große Sprachmodelle setzen, bewegen sich in Maschinengeschwindigkeit.

Wie weit das gehen kann, zeigt ein Vorfall aus diesem Jahr: Ein Angreifer setzte in seiner Angriffskette gegen FortiGate-Appliances einen eigens betriebenen MCP-Server ein, auf dem ein Sprachmodell lief. Die KI übernahm dabei die gesamte Kette – vom Erstzugang über das Abgreifen von Zugangsdaten bis zur Datenexfiltration. Das Ergebnis: 2.516 Organisationen in 106 Ländern wurden parallel kompromittiert. Der einzige menschliche Beitrag bestand darin, die Ergebnisse im Nachhinein zu sichten.

Fügt man dieser Lage nun eine Schwachstellensuche im Maßstab von Mythos hinzu, entsteht nicht automatisch eine sicherere Welt. Es entsteht eine Flut berechtigter Funde, die weiterhin menschliche Prüfung, organisatorische Prozesse, Erwägungen zur Betriebskontinuität und Patch-Zyklen erfordern, die sich seit einem Jahrzehnt nicht grundlegend verändert haben. Die naheliegende Frage nach Glasswing laute „Wie finden wir noch mehr Fehler?“ – die richtige Frage sei jedoch, ob ein Sicherheitsprogramm Tausende ausnutzbare Schwachstellen, die morgen früh auf dem Schreibtisch landen, überhaupt abarbeiten kann.

Ein Kernproblem ist die Priorisierung. Die meisten Schwachstellenmanagement-Programme ordnen Funde noch immer nach CVSS-Werten. Diese kontextfreie Kennzahl sagt aus, wie schlimm ein Fehler theoretisch sein könnte – nicht, ob er in der konkreten Infrastruktur unter den dort vorhandenen Schutzmaßnahmen ausnutzbar ist. Steigt das Volumen plötzlich von Hunderten auf Tausende, bremst kontextfreie Priorisierung den Prozess nicht nur, sie bringt ihn zum Erliegen. Den einen asymmetrischen Vorteil hätten dabei die Verteidiger: Sie kennen die Topologie ihrer Organisation, Angreifer nicht – sofern sie in Maschinengeschwindigkeit handeln können.

Der Beitrag stammt von Sıla Özeren Hacıoğlu, Security Research Engineer bei Picus Security; das Unternehmen entwickelt eine Plattform für Autonomous Exposure Validation, was die Autorin offenlegt. Aus dieser Perspektive rückt der Validierungsschritt in den Mittelpunkt – also die Frage, ob eine potenzielle Schwachstelle die eigene Umgebung tatsächlich kompromittieren würde. Picus verweist auf sein Werkzeug Swarm, eine Gruppe zusammenarbeitender KI-Agenten, die den traditionellen Vier-Tage-Zyklus auf Minuten verkürzen soll; vom Eingang einer CISA-Warnung bis zu validierten, abhilfebereiten Funden vergehen dem Anbieter zufolge rund drei Minuten.

Den Maßstab für Project Glasswing benennt die Autorin klar: Entscheidend werde sein, wie viele Schwachstellen gepatcht werden, bevor sie ausgenutzt werden – nicht, wie viele gefunden werden oder wie eindrucksvoll die Exploit-Ketten sind. Sichtbarkeit allein habe nie genügt; 83 Prozent der Sicherheitsprogramme zeigten weiterhin keine messbaren Ergebnisse.

Project Glasswing: KI findet die Schwachstellen schneller, als sie gepatcht werden

Ähnliche Artikel

Neueste Artikel