Das Klonen einer Stimme erfordert laut Long nur drei Sekunden Tonmaterial und einen kostenlosen Download. Eine Mailbox-Nachricht, ein Podcast-Auftritt, eine Telefonkonferenz zu Quartalszahlen oder ein LinkedIn-Video genügen, damit ein aktuelles KI-Modell in Echtzeit eine voll interaktive Stimmkopie erzeugt. Das Modell läuft offline, setzt kein technisches Wissen voraus und kostet nichts.
Die Zahlen, die Adaptive Security anführt, zeichnen einen steilen Anstieg: Vorfälle mit Stimm-Deepfakes nahmen 2025 im Jahresvergleich um 680 Prozent zu, allein in den USA wurden in einem Jahr mehr als 100.000 Angriffe registriert. Die zugrunde liegenden Werkzeuge stehen in öffentlichen Repositories bereit, unterliegen keiner Moderation und laufen auf gewöhnlicher Verbraucher-Hardware.
Wirksam werden die Angriffe durch die Vorbereitung. Bevor überhaupt ein Anruf erfolgt, kartieren die Täter das Organigramm des Ziels, identifizieren die Personen mit Finanzbefugnis und studieren den üblichen Freigabeprozess für Überweisungen. Im Visier stehen dabei der Controller, Sachbearbeiter der Kreditorenbuchhaltung und HR-Kräfte, die die Lohnabrechnung verantworten. Auch IT-Helpdesks werden mit dringenden Anfragen zum Zurücksetzen von Zugangsdaten kontaktiert — vorgetragen in einer Stimme, die exakt nach dem Technikvorstand klingt.
Die Angriffsfläche reicht weiter: KI-Personas tauchen inzwischen in Bewerbungsprozessen auf, aufgebaut aus gestohlenen LinkedIn-Profilen und darauf ausgelegt, Videointerviews zu bestehen. Einmal eingestellt, erhalten sie Zugriff auf interne Systeme, Quellcode und Unternehmensdaten.
Long beschreibt eine rasche Verbreitung: Als er vor rund eineinhalb Jahren begann, mit CISOs über die Bedrohung zu sprechen, hatte etwa einer von zehn einen erfolgreichen Deepfake-Angriff im eigenen Unternehmen erlebt; heute sei es über die Hälfte. Das meiste davon werde nie öffentlich, da Unternehmen kaum Anreiz hätten, einen Verlust von einer halben Million Dollar offenzulegen.
Bei den Schadenssummen nennt der Beitrag mehr als 200 Millionen Dollar allein in den ersten vier Monaten 2025, 359 Millionen Dollar für das gesamte Jahr 2024 und einen dokumentierten Gesamtschaden von inzwischen über 2,19 Milliarden Dollar weltweit, mit den USA als größtem Anteil. Unter den geschädigten Organisationen meldeten 61 Prozent Verluste über 100.000 Dollar, knapp 19 Prozent über 500.000 Dollar.
Als Gegenmaßnahmen empfiehlt Long drei kostenlose Kontrollen: ein verbales Codewort für hochwertige Finanzanfragen, einen verpflichtenden Rückruf an eine zuvor hinterlegte Nummer vor jeder Überweisung sowie die feste Regel, dass Dringlichkeit in einer Finanzanfrage ein Grund zum Innehalten ist. Die meisten Organisationen hätten keine davon eingerichtet.
Ein Beispiel für einen gescheiterten Angriff nennt er aus dem Juli 2025: Ein Angreifer imitierte mit einer KI-Stimme US-Außenminister Marco Rubio und verschickte über Signal Sprachnachrichten an Außenminister anderer Staaten, einen amtierenden Senator und einen Gouverneur. Keiner der Empfänger reagierte. Schon die Tatsache, dass die Anfragen über eine inoffizielle Consumer-App eintrafen, weckte Misstrauen; der Vorfall wurde dem Außenministerium gemeldet, bevor jemand antwortete.
Eine jährliche Pflichtschulung baue diesen Reflex nicht auf, argumentiert Long. Adaptive Security simuliere deshalb KI-gestützte Deepfake-Angriffe über Sprache, SMS, E-Mail und Video; falle ein Mitarbeiter darauf herein, passe die Plattform dessen Risikobewertung an und liefere eine auf das Szenario zugeschnittene Schulung.
