Nach Darstellung von Danelle Au beschleunigt sich der Einbau von KI in Sicherheitsprodukte derzeit branchenweit. Anbieter werben mit schnellerer Erkennung, autonomer Untersuchung und agentischer Reaktion. Der eigentliche Wandel spielt sich laut Au aber im Abrechnungsmodell ab: Weg von festen Softwarelizenzen, hin zu verbrauchsabhängigen Kosten, die durch maschinelle Nutzung entstehen und sich deutlich schlechter vorhersagen lassen.

Historisch seien Unternehmensanwendungen meist pro Nutzer, Gerät oder Endpunkt lizenziert worden. Anbieter von KI-Modellen rechnen dagegen pro Token ab, also grob pro Dreiviertelwort für eingelesene und ausgegebene Inhalte. Au nennt dafür konkrete Beispiele: Claude Sonnet 4.6 von Anthropic koste 3,00 US-Dollar pro Million Eingabe-Tokens und 15,00 US-Dollar pro Million Ausgabe-Tokens. GPT-5.5 liege bei 5,00 US-Dollar pro Million Eingabe-Tokens und 30,00 US-Dollar pro Million Ausgabe-Tokens. Diese Kosten träfen zunächst die Hersteller, wenn sie kommerzielle KI-Programmierschnittstellen nutzen, würden dann aber an Kunden weitergereicht, aufgeschlagen oder in SaaS-Preise eingerechnet.

Zwar seien die Preise für LLM-Programmierschnittstellen zwischen Anfang 2025 und Anfang 2026 laut Au um rund 80 Prozent gefallen. Für die Cybersicherheit sei das Problem damit aber nicht gelöst. Der Grund: Sicherheitsplattformen verarbeiten sehr große Datenmengen, und ihre Aufgaben reichen von einfacher Alarmbewertung bis zu komplexen, mehrstufigen Untersuchungen.

Au beziffert den Verbrauch exemplarisch. Die Einstufung eines einzelnen Alarms mit Basiskontext könne etwa 1.000 Tokens benötigen. Eine geführte Untersuchung, bei der die KI Telemetriedaten heranzieht und eine Ereigniskette bewertet, liege bei 20.000 bis 50.000 Tokens pro Vorfall. Noch aufwendiger seien vollständig autonome agentische Abläufe: Dabei lesen Agenten Hunderttausende Zeilen aus Rohtext-Protokollen, formulieren komplexe API-Aufrufe, bewerten Nutzlasten und führen den so gewonnenen Kontext fortlaufend an das Modell zurück. Eine einzelne komplexe Untersuchung über mehrere Stufen könne so in wenigen Minuten Millionen Tokens verbrauchen.

Als frühe Hinweise auf die Kostenentwicklung nennt Au mehrere Fälle. Ein nicht namentlich genanntes Unternehmen habe innerhalb eines Monats eine Claude-Rechnung von 500 Millionen US-Dollar angehäuft, weil Nutzungsgrenzen für Mitarbeiterlizenzen gefehlt hätten. Der Technikchef von Uber habe bis April bereits das gesamte KI-Budget für 2026 aufgebraucht. Und speziell im Sicherheitsbereich berichtet Au, dass Palo Alto Networks beim Test von Anthropic Claude Mythos gegen den eigenen Quellcode mehr als zwei Dutzend kritische Schwachstellen gefunden habe, dabei aber Token im Wert von mehr als 1 Million US-Dollar verbrauchte.

Für Sicherheitsabteilungen ergeben sich daraus laut Au drei zentrale Folgen. Erstens werde aus einem traditionell gut planbaren Budget ein variabler Betriebsaufwand ohne natürliche Obergrenze. Zweitens drohten operative Kompromisse: Wenn Limits mitten in einer Untersuchung erreicht würden, müssten Teams zwischen Zusatzkosten, gedrosselter Analyse oder manueller Bearbeitung wählen. Laut Au könnten Organisationen deshalb agentische Abläufe abschalten oder tiefgehende automatisierte Triage bei weniger wichtigen Alarmen auslassen, um monatliche Token-Kontingente zu schonen.

Drittens rücke die Bereitstellungsarchitektur in den Mittelpunkt. Cloud-Modelle reichten die schwankenden KI-Kosten direkt weiter, weil jede Argumentationsschleife, jeder API-Aufruf und jeder Schritt einer Multi-Agenten-Orchestrierung auf fremder Infrastruktur laufe. On-Premises-Architekturen könnten das laut Au mit lokalem, fest kalkulierbarem Rechenaufwand abfedern. Für Organisationen, die agentische KI dauerhaft und in voller Tiefe einsetzen wollen, sei On-Premises deshalb die einzige Architektur, bei der die Wirtschaftlichkeit aufgehe.

Au erwartet zudem neue Preismodelle der Anbieter auf Basis von Guthaben. Solche Systeme würden Tokens in „Operationen“ oder „KI-Guthaben“ übersetzen und damit vor allem ein Margenproblem der Anbieter lösen. Für CISOs bleibe der Kern des Problems jedoch derselbe: planbare Budgets weichen einer variablen Verbrauchslogik. Als sinnvolle Aufgabenteilung beschreibt Au drei Ebenen von KI im Sicherheitsbetrieb: Maschinelles Lernen für kontinuierliche Erkennung bei hohem Volumen, generative KI für Kontext und Schlussfolgerungen in der Untersuchung sowie agentische KI für autonome Aktionen.