
Mit GPT-5.1-Codex-Max präsentiert OpenAI ein spezialisiertes KI-Modell, das Entwicklungsaufgaben weitgehend autonom bewältigt. Das System kann stundenlang eigenständig arbeiten, komplette Projekte refactoren und dabei über mehrere Kontextfenster hinweg kohärent agieren. Doch die erweiterten Fähigkeiten werfen auch Sicherheitsfragen auf.
Agentenbasierte KI für Softwareentwicklung
OpenAI hat mit GPT-5.1-Codex-Max ein auf Softwareentwicklung spezialisiertes KI-Modell veröffentlicht, das komplexe Codierungsaufgaben mit minimalem menschlichen Eingriff durchführen kann. Das Modell ist ab sofort in der Codex-Plattform verfügbar – für CLI, IDE-Erweiterungen, Cloud-Integration und Code-Reviews. Der API-Zugang folgt in Kürze.
Im Gegensatz zu Allzweck-KI-Modellen wurde GPT-5.1-Codex-Max gezielt für agentenbasierte Aufgaben in Softwareentwicklung, Mathematik und Forschung trainiert. Das System durchläuft den gesamten Entwicklungszyklus – von der PR-Erstellung über Code-Reviews bis zur Frontend-Entwicklung.
Compaction-Technologie ermöglicht Langzeitaufgaben
Die zentrale Innovation ist ein Prozess namens „Compaction“: GPT-5.1-Codex-Max kann über mehrere Kontextfenster hinweg arbeiten und dabei Millionen von Tokens in einer einzigen Aufgabe kohärent verarbeiten. Wenn sich das System seiner Kontextfenstergrenze nähert, komprimiert es automatisch seinen Verlauf und bewahrt dabei den wichtigsten Kontext.
Dies ermöglicht Refactorings im Projektmaßstab, intensive Debugging-Sessions und mehrstündige Agent-Loops. In internen Tests arbeitete das Modell über 24 Stunden an einzelnen Aufgaben, iterierte beharrlich an Implementierungen und behob Testfehler eigenständig.
Token-Effizienz und Kostenreduktion
Das neue Modell zeigt deutliche Verbesserungen bei der Token-Effizienz. Auf dem SWE-bench Verified erreicht GPT-5.1-Codex-Max mit mittlerem Denkaufwand bessere Ergebnisse als sein Vorgänger – bei 30 Prozent weniger verbrauchten Denktoken. Für nicht latenzempfindliche Aufgaben steht ein „extra high“-Modus zur Verfügung.
Die Token-Effizienz schlägt sich in konkreten Kosteneinsparungen nieder: Frontend-Designs mit vergleichbarer Funktionalität und Ästhetik lassen sich wesentlich günstiger erstellen als mit GPT-5.1-Codex.
Cybersecurity-Fähigkeiten im Fokus
GPT-5.1-Codex-Max ist das leistungsfähigste Cybersecurity-Modell, das OpenAI bisher eingesetzt hat. Laut Systemkarte erreicht es zwar noch keine hohe Leistungsfähigkeit nach dem unternehmenseigenen Vorbereitungsrahmen, die agentenbasierten Cybersecurity-Funktionen entwickeln sich jedoch rasant.
OpenAI reagiert mit verstärkten Sicherheitsvorkehrungen: Eine spezielle Überwachung erkennt und unterbindet böswillige Aktivitäten. Verdächtige Nutzungsmuster werden an Policy-Monitoring-Systeme weitergeleitet. Die Teams haben bereits Cyberoperationen gestört, die versuchten, die Modelle zu missbrauchen.
OpenAI empfiehlt, Codex eingeschränkt zu halten, da die Aktivierung der Internetverbindung Prompt-Injection-Schwachstellen mit sich bringt. Das Unternehmen rät Entwicklern, den gesamten von KI generierten Code vor der Bereitstellung zu überprüfen.
Sandbox-Modus als Sicherheitsstandard
Codex läuft standardmäßig in einer sicheren Sandbox: Das Schreiben von Dateien ist auf den Arbeitsbereich beschränkt, der Netzwerkzugriff deaktiviert. OpenAI empfiehlt dringend, diesen eingeschränkten Modus beizubehalten, da die Aktivierung von Internet oder Websuche Prompt-Injection-Risiken aus nicht vertrauenswürdigen Quellen mit sich bringt.
Da das Modell zunehmend langandauernde Aufgaben autonom ausführt, wird die menschliche Kontrolle kritisch. Codex erstellt Terminalprotokolle und dokumentiert Tool-Aufrufe sowie Testergebnisse. OpenAI betont: Code-Reviews durch das Modell sollen menschliche Prüfungen ergänzen, nicht ersetzen.
Defensive Security im Vordergrund
OpenAI verfolgt einen iterativen Ansatz: Cybersecurity-Fähigkeiten können sowohl defensiv als auch offensiv eingesetzt werden. Das Unternehmen setzt auf Lernen aus der Praxis, kontinuierliche Updates der Sicherheitsvorkehrungen und Verteidigungsinstrumente wie automatisierte Schwachstellenscans.
Mit dem Aardvark-Programm sollen Verteidiger von den verbesserten Fähigkeiten profitieren können. Zusätzliche Risikominderungsmaßnahmen für fortgeschrittene Funktionen sind in Vorbereitung.
Verfügbarkeit und Produktivitätssteigerung
GPT-5.1-Codex-Max ist für ChatGPT Plus, Pro, Business, Edu und Enterprise verfügbar und ersetzt GPT-5.1-Codex als Standardmodell in Codex-Oberflächen. OpenAI empfiehlt die Verwendung ausschließlich für agentenbasierte Codierungsaufgaben in Codex oder vergleichbaren Umgebungen.
Intern nutzen 95 Prozent der OpenAI-Ingenieure Codex wöchentlich. Seit der Einführung liefern diese Ingenieure etwa 70 Prozent mehr Pull-Requests – ein deutlicher Indikator für gesteigerte Engineering-Produktivität.
Lesen Sie auch:
Bild/Quelle: https://depositphotos.com/de/home.html
Fachartikel

OpenClaw-Skills als neuer Malware-Verteilweg: Erkenntnisse von VirusTotal

ShinyHunters: Voice-Phishing-Kampagne zielt auf Cloud-Plattformen ab

ShinyHunters-Angriffe: Mandiant zeigt wirksame Schutzmaßnahmen gegen SaaS-Datendiebstahl

Phishing-Angriff: Cyberkriminelle missbrauchen Microsoft-Infrastruktur für Betrugsmaschen

Wie Angreifer proprietäre KI-Modelle über normale API-Zugriffe stehlen können
Studien

Deutsche Unicorn-Gründer bevorzugen zunehmend den Standort Deutschland

IT-Modernisierung entscheidet über KI-Erfolg und Cybersicherheit

Neue ISACA-Studie: Datenschutzbudgets werden trotz steigender Risiken voraussichtlich schrumpfen

Cybersecurity-Jahresrückblick: Wie KI-Agenten und OAuth-Lücken die Bedrohungslandschaft 2025 veränderten
![Featured image for “Phishing-Studie deckt auf: [EXTERN]-Markierung schützt Klinikpersonal kaum”](https://www.all-about-security.de/wp-content/uploads/2025/12/phishing-4.jpg)
Phishing-Studie deckt auf: [EXTERN]-Markierung schützt Klinikpersonal kaum
Whitepaper

DigiCert veröffentlicht RADAR-Bericht für Q4 2025

Koordinierte Cyberangriffe auf polnische Energieinfrastruktur im Dezember 2025

Künstliche Intelligenz bedroht demokratische Grundpfeiler

Insider-Risiken in Europa: 84 Prozent der Hochrisiko-Organisationen unzureichend vorbereitet

ETSI veröffentlicht weltweit führenden Standard für die Sicherung von KI
Hamsterrad-Rebell

NIS2: „Zum Glück gezwungen“ – mit OKR-basiertem Vorgehen zum nachhaltigen Erfolg

Cyberversicherung ohne Datenbasis? Warum CIOs und CISOs jetzt auf quantifizierbare Risikomodelle setzen müssen

Identity Security Posture Management (ISPM): Rettung oder Hype?

Platform Security: Warum ERP-Systeme besondere Sicherheitsmaßnahmen erfordern







