Mit GPT-5.6 ordnet OpenAI seine Produktlinie neu. Das Flaggschiff GPT-5.6 Sol ist für anspruchsvolle Schlussfolgerungsaufgaben ausgelegt. GPT-5.6 Terra richtet sich an alltägliche Arbeitslasten; OpenAI gibt an, dass es eine mit GPT-5.5 vergleichbare Leistung bei halben Betriebskosten erreiche. GPT-5.6 Luna positioniert das Unternehmen als schnelle Option zum niedrigsten Preis innerhalb der Serie.

Für den Bereich Cybersicherheit hebt OpenAI vor allem Sol hervor. In Tests auf ExploitBench habe das Modell zu konkurrierenden Systemen wie Mythos Preview aufgeschlossen und dabei nur etwa ein Drittel der Ausgabetoken benötigt. Das Unternehmen betont zugleich, dass Sol stärker auf defensive Sicherheitsaufgaben ausgerichtet sei, etwa auf die Identifikation von Schwachstellen und die Entwicklung von Patches, und nicht auf durchgängige Cyberangriffe.

Bei Auswertungen der Codebasen von Chromium und Firefox habe das System Fehler sowie grundlegende Primitive für eine Ausnutzung erfolgreich isoliert. Einen funktionsfähigen vollständigen Angriff über eine gesamte Exploit-Kette hinweg habe Sol jedoch nicht selbstständig konstruiert. Damit grenzt OpenAI die Fähigkeiten des Modells im offensiveren Bereich ausdrücklich ein.

Um mögliche Risiken durch die Doppelnutzung zu begrenzen, also Fälle, in denen defensive Forschung eng an offensives Verhalten heranreicht, setzt die GPT-5.6-Reihe laut OpenAI auf eine mehrschichtige Sicherheitsarchitektur. Neben den üblichen Verweigerungsmechanismen auf Trainingsebene kommen automatisierte Echtzeit-Klassifikatoren für Eingaben aus Biologie und Cybersicherheit zum Einsatz. Wird eine Auffälligkeit erkannt, stoppt die Generierung von Ausgaben, während ein zweites Schlussfolgerungsmodell den Gesprächskontext überprüft.

In einzelnen Fällen können zudem Prüfungen auf Kontoebene ausgelöst werden. Sie sollen dabei helfen, legitime Sicherheitsforschung von böswilligem Verhalten zu unterscheiden. OpenAI zufolge ist das Teil des Sicherheitskonzepts für die kontrollierte Einführung der Modelle.

Nach Angaben des Unternehmens flossen mehr als 700.000 A100-äquivalente GPU-Stunden in automatisiertes Red-Teaming, um das Modell gegen systemische Schwachstellen zu härten. Der Schwerpunkt habe darauf gelegen, universelle Jailbreaks zu finden und nicht nur einzelne Eingabeaufforderungen, die Schutzmechanismen umgehen.

Derzeit sind die Modelle nur über die API und Codex für zugelassene Partner verfügbar. In den kommenden Wochen will OpenAI die allgemeine Verfügbarkeit auf ChatGPT, Codex und breitere API-Nutzer ausweiten. Zugleich spricht sich das Unternehmen öffentlich dagegen aus, eine staatlich vermittelte Vorabfreigabe dauerhaft zum Standard für KI-Einführungen zu machen. Länger anhaltende Beschränkungen würden nach Ansicht von OpenAI wichtige defensive Werkzeuge daran hindern, die breitere Cybersicherheitsgemeinschaft zu erreichen.