Nach Darstellung von OpenAI soll Lockdown Mode die Angriffsfläche gegenüber Prompt Injections verkleinern. Der Schutz baut auf Sandboxing und bereits vorhandenen Kontrollen auf und zielt insbesondere auf URL-basierte Mechanismen zur Datenausleitung. Konkret werden ausgehende Netzwerkanfragen eingeschränkt, über die sensible Informationen an eine von Angreifern kontrollierte Infrastruktur übertragen werden könnten.

OpenAI betont zugleich die Grenzen des neuen Modus. Lockdown Mode soll nicht verhindern, dass Prompt Injections überhaupt stattfinden. Auch an der Funktionsweise von Memory, Datei-Uploads oder der Möglichkeit, Konversationen zu teilen, ändert sich laut Unternehmen nichts. Der Ansatz besteht vielmehr darin, potenzielle Kanäle zu beseitigen, über die Daten abfließen könnten. Dafür deaktiviert der Modus mehrere Funktionen.

Der Hersteller weist ausdrücklich darauf hin, dass die Funktion nicht für alle gedacht ist. Lockdown Mode ist als optionale Einstellung konzipiert und lässt sich nicht gleichzeitig mit dem Developer Mode verwenden. Wird einer der beiden Modi aktiviert, deaktiviert dies den jeweils anderen.

Einen vollständigen Schutz verspricht OpenAI nicht. Das Unternehmen erklärt, Lockdown Mode sei darauf ausgelegt, das Risiko einer auf Prompt Injection basierenden Datenausleitung in ChatGPT und unterstützten OpenAI-Produkten deutlich zu senken, garantiere aber nicht, dass ein Datenabfluss ausgeschlossen ist. Restrisiken könnten über aktivierte Apps, unvorhergesehene Kombinationen von Fähigkeiten oder neu entdeckte Techniken bestehen bleiben.

Außerdem verhindert der Modus laut OpenAI nicht alle anderen Auswirkungen von Prompt-Injection-Angriffen. So könne eine bösartige Anweisung, die in einer hochgeladenen Datei verborgen ist, weiterhin das Verhalten von ChatGPT beeinflussen und etwa zu einer falschen Antwort führen.

Parallel dazu hat OpenAI eine neue Funktion zur Kontoverwaltung gestartet. Nutzer können damit aktive ChatGPT-Sitzungen überprüfen und sich bei Anzeichen unbefugter Kontonutzung aus einzelnen oder aus allen Sitzungen abmelden. In der Übersicht der Sitzungen werden laut OpenAI Informationen zum Gerät, zur verwendeten App, zum ungefähren Standort, zu Datum und Uhrzeit der Anmeldung sowie dazu angezeigt, ob das Gerät als vertrauenswürdig gilt und ob es sich um die aktuelle Sitzung handelt.