OpenAI startet GPT-5.1 Codex Max: KI optimiert Softwareentwicklung

Mit GPT-5.1-Codex-Max präsentiert OpenAI ein spezialisiertes KI-Modell, das Entwicklungsaufgaben weitgehend autonom bewältigt. Das System kann stundenlang eigenständig arbeiten, komplette Projekte refactoren und dabei über mehrere Kontextfenster hinweg kohärent agieren. Doch die erweiterten Fähigkeiten werfen auch Sicherheitsfragen auf.

Agentenbasierte KI für Softwareentwicklung

OpenAI hat mit GPT-5.1-Codex-Max ein auf Softwareentwicklung spezialisiertes KI-Modell veröffentlicht, das komplexe Codierungsaufgaben mit minimalem menschlichen Eingriff durchführen kann. Das Modell ist ab sofort in der Codex-Plattform verfügbar – für CLI, IDE-Erweiterungen, Cloud-Integration und Code-Reviews. Der API-Zugang folgt in Kürze.

Im Gegensatz zu Allzweck-KI-Modellen wurde GPT-5.1-Codex-Max gezielt für agentenbasierte Aufgaben in Softwareentwicklung, Mathematik und Forschung trainiert. Das System durchläuft den gesamten Entwicklungszyklus – von der PR-Erstellung über Code-Reviews bis zur Frontend-Entwicklung.

Compaction-Technologie ermöglicht Langzeitaufgaben

Die zentrale Innovation ist ein Prozess namens „Compaction“: GPT-5.1-Codex-Max kann über mehrere Kontextfenster hinweg arbeiten und dabei Millionen von Tokens in einer einzigen Aufgabe kohärent verarbeiten. Wenn sich das System seiner Kontextfenstergrenze nähert, komprimiert es automatisch seinen Verlauf und bewahrt dabei den wichtigsten Kontext.

Dies ermöglicht Refactorings im Projektmaßstab, intensive Debugging-Sessions und mehrstündige Agent-Loops. In internen Tests arbeitete das Modell über 24 Stunden an einzelnen Aufgaben, iterierte beharrlich an Implementierungen und behob Testfehler eigenständig.

Token-Effizienz und Kostenreduktion

Das neue Modell zeigt deutliche Verbesserungen bei der Token-Effizienz. Auf dem SWE-bench Verified erreicht GPT-5.1-Codex-Max mit mittlerem Denkaufwand bessere Ergebnisse als sein Vorgänger – bei 30 Prozent weniger verbrauchten Denktoken. Für nicht latenzempfindliche Aufgaben steht ein „extra high“-Modus zur Verfügung.

Die Token-Effizienz schlägt sich in konkreten Kosteneinsparungen nieder: Frontend-Designs mit vergleichbarer Funktionalität und Ästhetik lassen sich wesentlich günstiger erstellen als mit GPT-5.1-Codex.

Cybersecurity-Fähigkeiten im Fokus

GPT-5.1-Codex-Max ist das leistungsfähigste Cybersecurity-Modell, das OpenAI bisher eingesetzt hat. Laut Systemkarte erreicht es zwar noch keine hohe Leistungsfähigkeit nach dem unternehmenseigenen Vorbereitungsrahmen, die agentenbasierten Cybersecurity-Funktionen entwickeln sich jedoch rasant.

OpenAI reagiert mit verstärkten Sicherheitsvorkehrungen: Eine spezielle Überwachung erkennt und unterbindet böswillige Aktivitäten. Verdächtige Nutzungsmuster werden an Policy-Monitoring-Systeme weitergeleitet. Die Teams haben bereits Cyberoperationen gestört, die versuchten, die Modelle zu missbrauchen.

OpenAI empfiehlt, Codex eingeschränkt zu halten, da die Aktivierung der Internetverbindung Prompt-Injection-Schwachstellen mit sich bringt. Das Unternehmen rät Entwicklern, den gesamten von KI generierten Code vor der Bereitstellung zu überprüfen.

Sandbox-Modus als Sicherheitsstandard

Codex läuft standardmäßig in einer sicheren Sandbox: Das Schreiben von Dateien ist auf den Arbeitsbereich beschränkt, der Netzwerkzugriff deaktiviert. OpenAI empfiehlt dringend, diesen eingeschränkten Modus beizubehalten, da die Aktivierung von Internet oder Websuche Prompt-Injection-Risiken aus nicht vertrauenswürdigen Quellen mit sich bringt.

Da das Modell zunehmend langandauernde Aufgaben autonom ausführt, wird die menschliche Kontrolle kritisch. Codex erstellt Terminalprotokolle und dokumentiert Tool-Aufrufe sowie Testergebnisse. OpenAI betont: Code-Reviews durch das Modell sollen menschliche Prüfungen ergänzen, nicht ersetzen.

Defensive Security im Vordergrund

OpenAI verfolgt einen iterativen Ansatz: Cybersecurity-Fähigkeiten können sowohl defensiv als auch offensiv eingesetzt werden. Das Unternehmen setzt auf Lernen aus der Praxis, kontinuierliche Updates der Sicherheitsvorkehrungen und Verteidigungsinstrumente wie automatisierte Schwachstellenscans.

Mit dem Aardvark-Programm sollen Verteidiger von den verbesserten Fähigkeiten profitieren können. Zusätzliche Risikominderungsmaßnahmen für fortgeschrittene Funktionen sind in Vorbereitung.

Verfügbarkeit und Produktivitätssteigerung

GPT-5.1-Codex-Max ist für ChatGPT Plus, Pro, Business, Edu und Enterprise verfügbar und ersetzt GPT-5.1-Codex als Standardmodell in Codex-Oberflächen. OpenAI empfiehlt die Verwendung ausschließlich für agentenbasierte Codierungsaufgaben in Codex oder vergleichbaren Umgebungen.

Intern nutzen 95 Prozent der OpenAI-Ingenieure Codex wöchentlich. Seit der Einführung liefern diese Ingenieure etwa 70 Prozent mehr Pull-Requests – ein deutlicher Indikator für gesteigerte Engineering-Produktivität.

Lesen Sie auch:

Google kündigt erweiterte Sicherheitsfunktionen für KI an

Microsoft reagiert auf neue KI-Bedrohung: Richtlinien gegen indirekte Prompt-Injection-Angriffe

Ihre KI ist nicht sicher: Wie LLM-Hijacking und Prompt-Leaks eine neue Welle von Datenverstößen auslösen

Princeton-Forscher warnen vor fatalen KI-Angriffen im Web3-Umfeld

Bild/Quelle: https://depositphotos.com/de/home.html

Folgen Sie uns auf X

Folgen Sie uns auf Bluesky

Folgen Sie uns auf Mastodon

Hamsterrad Rebell – Cyber Talk

OpenAI launcht GPT-5.1-Codex-Max: Autonomer KI-Agent übernimmt komplexe Entwicklungsaufgaben

Agentenbasierte KI für Softwareentwicklung

Compaction-Technologie ermöglicht Langzeitaufgaben

Token-Effizienz und Kostenreduktion

Cybersecurity-Fähigkeiten im Fokus

Sandbox-Modus als Sicherheitsstandard

Defensive Security im Vordergrund

Verfügbarkeit und Produktivitätssteigerung

Fachartikel

Diesel Vortex: Russische Phishing-Gruppe greift systematisch Logistikunternehmen an

Oblivion: Neue Android-Malware umgeht Sicherheitsschichten auf Samsung, Xiaomi und Co.

Starkiller: Phishing-Framework setzt auf Echtzeit-Proxy statt HTML-Klone

LockBit-Ransomware über Apache-ActiveMQ-Lücke: Angriff in zwei Wellen

Infoblox erweitert DDI-Portfolio: Neue Integrationen für Multi-Cloud und stärkere Automatisierung

Studien

KI beschleunigt Cyberangriffe: IBM X-Force warnt vor wachsenden Schwachstellen in Unternehmen

Finanzsektor unterschätzt Cyber-Risiken: Studie offenbart strukturelle Defizite in der IT-Sicherheit

CrowdStrike Global Threat Report 2026: KI beschleunigt Cyberangriffe und weitet Angriffsflächen aus

IT-Sicherheit in Großbritannien: Hohe Vorfallsquoten, steigende Budgets – doch der Wandel stockt

IT-Budgets 2026: Deutsche Unternehmen investieren mehr – und fordern messbaren Gegenwert

Whitepaper

Third Party Risk Management – auch das Procurement benötigt technische Unterstützung

EU-Toolbox für IKT-Lieferkettensicherheit: Gemeinsamer Rahmen zur Risikominderung

EU-Behörden stärken Cybersicherheit: CERT-EU und ENISA veröffentlichen neue Rahmenwerke

WatchGuard Internet Security Report zeigt über 1.500 Prozent mehr neuartige Malware auf

Armis Labs Report 2026: Früherkennung als Schlüsselfaktor im Finanzsektor angesichts KI-gestützter Bedrohungen

Hamsterrad-Rebell

Incident Response Retainer – worauf sollte man achten?

KI‑basierte E‑Mail‑Angriffe: Einfach gestartet, kaum zu stoppen

NIS2: „Zum Glück gezwungen“ – mit OKR-basiertem Vorgehen zum nachhaltigen Erfolg

Cyberversicherung ohne Datenbasis? Warum CIOs und CISOs jetzt auf quantifizierbare Risikomodelle setzen müssen

Identity Security Posture Management (ISPM): Rettung oder Hype?