
Anthropic erweitert sein KI-Portfolio um Claude Opus 4.6, das intelligenteste Modell der aktuellen Generation. Mit einem erweiterten Kontextfenster von einer Million Token, optimierten Agenten-Funktionen und branchenführenden Benchmark-Ergebnissen positioniert sich das Unternehmen im Wettbewerb der großen Sprachmodelle neu.
Technische Verbesserungen im Überblick
Das aktualisierte Modell zeigt deutliche Fortschritte gegenüber seinem Vorgänger Claude Opus 4.5. Die Entwickler haben insbesondere die Fähigkeiten für komplexe Programmieraufgaben ausgebaut. Das System plant methodischer, bearbeitet agentenbasierte Prozesse über längere Zeiträume und arbeitet zuverlässiger in umfangreichen Code-Repositories.
Erstmals in der Opus-Reihe unterstützt Version 4.6 ein Kontextfenster von einer Million Token in der Beta-Phase. Diese Kapazität ermöglicht die Verarbeitung deutlich größerer Datenmengen in einem einzigen Durchlauf.
Neben den Coding-Verbesserungen hat Anthropic die Einsatzmöglichkeiten für betriebswirtschaftliche Aufgaben erweitert. Das Modell kann Finanzanalysen durchführen, Recherchen anstellen sowie verschiedene Dokumentformate wie Tabellen und Präsentationen verarbeiten und erstellen. In der Cowork-Umgebung lassen sich diese Funktionen für autonomes Multitasking nutzen.
Benchmark-Ergebnisse im Branchenvergleich
Bei mehreren Leistungstests erreicht Opus 4.6 Spitzenwerte. In der agentenbasierten Codierungs-Bewertung Terminal-Bench 2.0 erzielt das Modell die höchste Punktzahl. Auch bei Humanity’s Last Exam, einem anspruchsvollen multidisziplinären Logiktest, liegt es vor der Konkurrenz.
Besonders deutlich zeigt sich der Vorsprung bei GDPval-AA, einer Bewertung für wirtschaftlich relevante Wissensaufgaben in Bereichen wie Finanzen und Recht. Hier übertrifft Opus 4.6 das zweitplatzierte Modell GPT-5.2 von OpenAI um etwa 144 Elo-Punkte. Gegenüber Claude Opus 4.5 beträgt der Abstand 190 Punkte.
Bei BrowseComp, das die Fähigkeit misst, schwer auffindbare Online-Informationen zu lokalisieren, schneidet das neue Modell ebenfalls besser ab als alle Wettbewerber.
Verbesserte Kontextverarbeitung
Die Leistung bei der Informationsextraktion aus großen Dokumentensammlungen hat sich erheblich verbessert. Das Modell speichert und verfolgt Informationen über hunderttausende Token mit geringeren Abweichungen und erfasst auch versteckte Details, die frühere Versionen übersehen hätten.
Ein häufiges Problem bei KI-Modellen ist die nachlassende Leistung bei längeren Gesprächen, die eine bestimmte Token-Anzahl überschreiten. Opus 4.6 zeigt hier deutliche Verbesserungen: Bei der 8-Needle-1M-Variante von MRCR v2, einem Benchmark-Test für das Auffinden versteckter Informationen in großen Textmengen, erreicht das neue Modell 76 Prozent, während Sonnet 4.5 nur auf 18,5 Prozent kommt.
Sicherheitskonzept und Verhaltenskontrolle
Anthropic hat für Opus 4.6 umfangreiche Sicherheitsbewertungen durchgeführt. Das Unternehmen wendet dabei erstmals verschiedene neue Tests an und hat mehrere bestehende Prüfverfahren aktualisiert.
Bei automatisierten Verhaltensprüfungen zeigt das Modell niedrige Raten an unangemessenen Reaktionen wie Täuschung, Schmeichelei oder der Förderung problematischer Nutzervorstellungen. Laut Systemkarte weist Opus 4.6 ein Sicherheitsprofil auf, das mindestens gleichwertig oder besser ist als das anderer führender Modelle in der Branche.
Die Rate der Überablehnungen, bei denen das System harmlose Anfragen ablehnt, liegt niedriger als bei allen aktuellen Claude-Modellen.
Anthropic hat zusätzliche Bewertungen für das Wohlbefinden der Nutzer entwickelt, komplexere Tests zur Ablehnung potenziell problematischer Anfragen implementiert und die Prüfungen für heimlich schädliche Aktionen aktualisiert. Das Unternehmen experimentiert außerdem mit neuen Methoden aus dem Bereich der Interpretierbarkeit, um das Verhalten des Modells besser zu verstehen.
Cybersicherheit: Offensive und defensive Maßnahmen
Da Opus 4.6 verbesserte Cybersicherheitsfähigkeiten aufweist, hat Anthropic sechs neue Cybersicherheits-Probes entwickelt. Diese Mechanismen helfen dabei, verschiedene Formen potenziellen Missbrauchs zu erkennen.
Parallel fördert das Unternehmen den defensiven Einsatz des Modells. Es wird bereits genutzt, um Schwachstellen in Open-Source-Software zu identifizieren und zu beheben. Anthropic betrachtet es als wichtig, dass Verteidiger im Cybersicherheitsbereich KI-Modelle wie Claude einsetzen können.
Das Unternehmen kündigt an, die Sicherheitsvorkehrungen kontinuierlich anzupassen, sobald neue Erkenntnisse über potenzielle Bedrohungen vorliegen. In naher Zukunft könnten Echtzeit-Interventionen zur Blockierung von Missbrauch eingeführt werden.
API-Funktionen für Entwickler
Auf der API-Ebene erhalten Entwickler mehr Kontrolle über den Modellaufwand und größere Flexibilität für langfristig laufende Agenten. Anthropic führt dafür mehrere neue Funktionen ein:
Adaptives Denken: Bisher konnten Entwickler das erweiterte Denken nur aktivieren oder deaktivieren. Mit der neuen Funktion entscheidet Claude selbst, wann tieferes Denken hilfreich ist. Auf der Standard-Aufwandsstufe nutzt das Modell erweitertes Denken situationsabhängig, wobei Entwickler die Stufe anpassen können.
Aufwandsstufen: Es stehen vier Optionen zur Verfügung: niedrig, mittel, hoch (Standard) und maximal. Anthropic empfiehlt, verschiedene Einstellungen zu testen.
Kontextverdichtung (Beta): Langfristige Gespräche und agentenbasierte Aufgaben erreichen oft die Grenzen des Kontextfensters. Die neue Funktion fasst automatisch ältere Kontexte zusammen und ersetzt sie, wenn die Konversation einen konfigurierbaren Schwellenwert erreicht.
1 Million Token-Kontext (Beta): Opus 4.6 ist das erste Opus-Modell mit dieser Kapazität. Für Prompts über 200.000 Token gilt ein Premium-Preis von 10 beziehungsweise 37,50 Dollar pro Million Eingabe- oder Ausgabe-Token.
128.000 Ausgabetoken: Das Modell unterstützt Ausgaben bis zu dieser Größe, sodass umfangreiche Aufgaben nicht in mehrere Anfragen aufgeteilt werden müssen.
Inferenz nur in den USA: Für Workloads, die in den Vereinigten Staaten ausgeführt werden müssen, steht diese Option zum 1,1-fachen Tokenpreis zur Verfügung.
Produktaktualisierungen für Anwender
Anthropic hat Claude und Claude Code um Funktionen erweitert, mit denen Wissensarbeiter und Entwickler komplexere Aufgaben bewältigen können.
In Claude Code sind nun Agententeams als Forschungsvorschau verfügbar. Nutzer können mehrere Agenten parallel starten, die als Team arbeiten und sich selbstständig koordinieren. Dies eignet sich besonders für Aufgaben, die sich in unabhängige Arbeiten wie Code-Reviews aufteilen lassen. Jeder Subagent kann direkt mit Tastenkombinationen oder tmux übernommen werden.
Die Integration mit Office-Tools wurde verbessert. Claude in Excel bewältigt nun aufwendigere und komplexere Aufgaben mit optimierter Leistung. Das System kann vor der Ausführung planen, unstrukturierte Daten verarbeiten und eigenständig die richtige Struktur ableiten sowie mehrstufige Änderungen in einem Durchgang umsetzen.
In Kombination mit Claude in PowerPoint können Nutzer Daten zunächst in Excel verarbeiten und dann in PowerPoint visualisieren. Das System liest Layouts, Schriftarten und Folienvorlagen, um das Markenimage zu wahren – unabhängig davon, ob mit Vorlagen gearbeitet oder eine vollständige Präsentation aus einer Beschreibung erstellt wird. Claude in PowerPoint ist als Forschungsvorschau für die Pläne Max, Team und Enterprise verfügbar.
Verfügbarkeit und Preisgestaltung
Claude Opus 4.6 ist ab sofort auf claude.ai, über die API und auf allen wichtigen Cloud-Plattformen verfügbar. Entwickler können über die Claude API mit dem Modellstring „claude-opus-4-6“ darauf zugreifen.
Die Preisstruktur bleibt bei 5 Dollar für Input und 25 Dollar für Output pro Million Token unverändert. Detaillierte Preisinformationen stehen auf der Preisseite des Unternehmens zur Verfügung.
Umfassende Informationen zu allen Leistungs- und Sicherheitsbewertungen finden sich in der Claude Opus 4.6-Systemkarte, die Anthropic veröffentlicht hat.
Hinweis: Die im Originaldokument erwähnte umfangreiche Bewertung von durch LLM entdeckten 0-Days im Titel wurde im Haupttext nicht weiter ausgeführt und findet sich primär im Kontext der Cybersicherheits-Funktionen wieder.
Mehr Lesestoff:
Fachartikel

KI-Modelle entdecken kritische Sicherheitslücken in jahrzehntealter Software

KI-generierter Code folgt gefährlichen Mustern: Forscher entwickeln Angriffsmethode FSTab

DDoS-Attacken 2025: Rekordangriff mit 31,4 Tbit/s und 121% mehr Angriffe

SonicWall-VPN-Einbruch: Angreifer deaktivieren EDR über Kernel-Ebene mit widerrufenen Treibern

OpenClaw-Skills als neuer Malware-Verteilweg: Erkenntnisse von VirusTotal
Studien

Sicherheitsstudie 2026: Menschliche Faktoren übertreffen KI-Risiken

Studie: Unternehmen müssen ihre DNS- und IP-Management-Strukturen für das KI-Zeitalter neu denken

Deutsche Unicorn-Gründer bevorzugen zunehmend den Standort Deutschland

IT-Modernisierung entscheidet über KI-Erfolg und Cybersicherheit

Neue ISACA-Studie: Datenschutzbudgets werden trotz steigender Risiken voraussichtlich schrumpfen
Whitepaper

IT-Budgets 2026 im Fokus: Wie Unternehmen 27 % Cloud-Kosten einsparen können

DigiCert veröffentlicht RADAR-Bericht für Q4 2025

Koordinierte Cyberangriffe auf polnische Energieinfrastruktur im Dezember 2025

Künstliche Intelligenz bedroht demokratische Grundpfeiler

Insider-Risiken in Europa: 84 Prozent der Hochrisiko-Organisationen unzureichend vorbereitet
Hamsterrad-Rebell

KI‑basierte E‑Mail‑Angriffe: Einfach gestartet, kaum zu stoppen

NIS2: „Zum Glück gezwungen“ – mit OKR-basiertem Vorgehen zum nachhaltigen Erfolg

Cyberversicherung ohne Datenbasis? Warum CIOs und CISOs jetzt auf quantifizierbare Risikomodelle setzen müssen

Identity Security Posture Management (ISPM): Rettung oder Hype?









