OpenAI stellt GPT-5.6 vor: Sol als führendes Modell für Cybersicherheitsaufgaben

Zusammenfassung

OpenAI hat eine eingeschränkte Vorschau auf seine neue Modellreihe GPT-5.6 angekündigt. Die Familie umfasst drei nach Leistungsstufen benannte Systeme: Sol, Terra und Luna. Sol beschreibt das Unternehmen als sein leistungsfähigstes Modell für Cybersicherheit. Der Start erfolgt zunächst nur für einen ausgewählten Kreis vertrauenswürdiger Partner und geht laut OpenAI auf Konsultationen mit der Regierung der Vereinigten Staaten zurück. Hintergrund ist ein vorläufig gestaffelter Rollout, während das Unternehmen gemeinsam mit der Bundesregierung an einem Rahmen arbeitet, der sich an einer jüngsten Executive Order orientiert. Diese soll es der Regierung ermöglichen, Risiken fortgeschrittener KI-Systeme für die nationale Sicherheit zu bewerten. In der Positionierung setzt OpenAI zugleich auf ein neues Namensschema: Die Versionsnummer kennzeichnet die Modellgeneration, die Namen stehen dauerhaft für Fähigkeitsstufen. Sol ist dabei das Spitzenmodell für rechenintensive Denkaufgaben, Terra für Alltagslasten und Luna als schnelle, günstigste Variante der Reihe vorgesehen.

Mit GPT-5.6 ordnet OpenAI seine Produktlinie neu. Das Flaggschiff GPT-5.6 Sol ist für anspruchsvolle Schlussfolgerungsaufgaben ausgelegt. GPT-5.6 Terra richtet sich an alltägliche Arbeitslasten; OpenAI gibt an, dass es eine mit GPT-5.5 vergleichbare Leistung bei halben Betriebskosten erreiche. GPT-5.6 Luna positioniert das Unternehmen als schnelle Option zum niedrigsten Preis innerhalb der Serie.

Für den Bereich Cybersicherheit hebt OpenAI vor allem Sol hervor. In Tests auf ExploitBench habe das Modell zu konkurrierenden Systemen wie Mythos Preview aufgeschlossen und dabei nur etwa ein Drittel der Ausgabetoken benötigt. Das Unternehmen betont zugleich, dass Sol stärker auf defensive Sicherheitsaufgaben ausgerichtet sei, etwa auf die Identifikation von Schwachstellen und die Entwicklung von Patches, und nicht auf durchgängige Cyberangriffe.

Bei Auswertungen der Codebasen von Chromium und Firefox habe das System Fehler sowie grundlegende Primitive für eine Ausnutzung erfolgreich isoliert. Einen funktionsfähigen vollständigen Angriff über eine gesamte Exploit-Kette hinweg habe Sol jedoch nicht selbstständig konstruiert. Damit grenzt OpenAI die Fähigkeiten des Modells im offensiveren Bereich ausdrücklich ein.

Um mögliche Risiken durch die Doppelnutzung zu begrenzen, also Fälle, in denen defensive Forschung eng an offensives Verhalten heranreicht, setzt die GPT-5.6-Reihe laut OpenAI auf eine mehrschichtige Sicherheitsarchitektur. Neben den üblichen Verweigerungsmechanismen auf Trainingsebene kommen automatisierte Echtzeit-Klassifikatoren für Eingaben aus Biologie und Cybersicherheit zum Einsatz. Wird eine Auffälligkeit erkannt, stoppt die Generierung von Ausgaben, während ein zweites Schlussfolgerungsmodell den Gesprächskontext überprüft.

In einzelnen Fällen können zudem Prüfungen auf Kontoebene ausgelöst werden. Sie sollen dabei helfen, legitime Sicherheitsforschung von böswilligem Verhalten zu unterscheiden. OpenAI zufolge ist das Teil des Sicherheitskonzepts für die kontrollierte Einführung der Modelle.

Nach Angaben des Unternehmens flossen mehr als 700.000 A100-äquivalente GPU-Stunden in automatisiertes Red-Teaming, um das Modell gegen systemische Schwachstellen zu härten. Der Schwerpunkt habe darauf gelegen, universelle Jailbreaks zu finden und nicht nur einzelne Eingabeaufforderungen, die Schutzmechanismen umgehen.

Derzeit sind die Modelle nur über die API und Codex für zugelassene Partner verfügbar. In den kommenden Wochen will OpenAI die allgemeine Verfügbarkeit auf ChatGPT, Codex und breitere API-Nutzer ausweiten. Zugleich spricht sich das Unternehmen öffentlich dagegen aus, eine staatlich vermittelte Vorabfreigabe dauerhaft zum Standard für KI-Einführungen zu machen. Länger anhaltende Beschränkungen würden nach Ansicht von OpenAI wichtige defensive Werkzeuge daran hindern, die breitere Cybersicherheitsgemeinschaft zu erreichen.

OpenAI stellt GPT-5.6 vor: Sol als führendes Modell für Cybersicherheitsaufgaben

Ähnliche Artikel

Neueste Artikel