Claude Opus 4.7: Anthropics neues Coding-Flaggschiff

Opus 4.7: Anthropics neues Flaggschiff für komplexe Coding-Aufgaben

Anthropic hat mit Claude Opus 4.7 die nächste Iteration seines leistungsstärksten öffentlich verfügbaren Modells vorgestellt. Der Fokus liegt klar auf anspruchsvoller Softwareentwicklung: Aufgaben, die zuvor enge Aufsicht erforderten, sollen Entwicklerinnen und Entwickler nun mit Vertrauen an das Modell delegieren können. Opus 4.7 ist ab sofort über die Claude API, Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry verfügbar – zu den unveränderten Preisen von 5 USD pro Million Input-Tokens und 25 USD pro Million Output-Tokens.

Was ist neu an Opus 4.7?

Im Vergleich zum Vorgänger Opus 4.6 bringt das Modell laut Anthropic substantielle Verbesserungen in mehreren Kernbereichen mit:

Lange, autonome Aufgaben – Opus 4.7 bearbeitet komplexe, mehrstufige Coding-Workflows mit hoher Konsistenz und verifiziert seine eigenen Ergebnisse, bevor es zurückmeldet.
Strikte Instruktionsbefolgung – Das Modell interpretiert Anweisungen wörtlicher als frühere Versionen. Prompts, die für ältere Modelle geschrieben wurden, sollten daher angepasst werden.
Hochauflösende Bildverarbeitung – Mit bis zu 2.576 Pixeln auf der langen Kante (rund 4 Megapixel) verdreifacht sich die Auflösung gegenüber bisherigen Claude-Modellen. Das eröffnet neue Use Cases für Computer-Use-Agenten, Diagramm-Analyse und visuelle Datenextraktion.
Persistentes Memory – Über dateisystembasiertes Gedächtnis behält Opus 4.7 Kontext über Sessions hinweg und benötigt weniger Vorab-Briefing für mehrtägige Projekte.

Benchmark-Performance: Stark im Coding, gemischt im Rest

Auf den klassischen Coding-Benchmarks SWE-Bench Pro und SWE-Bench Verified setzt Opus 4.7 neue Bestmarken. Auch auf der GDPval-Bewertung wirtschaftlich relevanter Wissensarbeit – etwa in Finance, Legal und Analyse – erreicht das Modell State-of-the-Art-Werte. Anthropic hebt hervor, dass Opus 4.7 als „effektiverer Finanzanalyst" als sein Vorgänger arbeitet und professionellere Präsentationen, Folien und Dokumente erstellt.

Die Resultate sind allerdings nicht durchgängig positiv: Auf einzelnen Benchmarks – etwa bei Agentic Search – liegt Opus 4.7 unter Opus 4.6. In „Humanity's Last Exam" mit Tools übertreffen Konkurrenzmodelle das System deutlich. Anthropic bezeichnet Opus 4.7 selbst als nicht so leistungsstark wie das interne Forschungsmodell „Claude Mythos Preview", dessen Veröffentlichung weiterhin limitiert bleibt.

Neue Werkzeuge für Entwicklerteams

Mit dem Release führt Anthropic mehrere produktbezogene Neuerungen ein:

Extra-High Effort Level – Eine neue Stufe zwischen „high" und „max" gibt feinere Kontrolle über das Verhältnis von Latenz, Kosten und Antwortqualität. In Claude Code ist Extra-High die neue Standardeinstellung.
Ultra Review – Ein neuer Slash-Befehl in Claude Code startet eine dedizierte Review-Session, die Code-Änderungen analysiert und Bugs sowie Design-Probleme markiert, die einer sorgfältigen Code-Review entsprechen würden.
Verbesserte Cyber-Safeguards – Opus 4.7 ist die erste Stufe einer neuen Safety-Architektur, die später auch für leistungsfähigere Modelle wie Mythos genutzt werden soll. Anfragen, die auf hochriskante Cyber-Anwendungsfälle hindeuten, werden automatisch blockiert.

Was das für Unternehmen bedeutet

Opus 4.7 positioniert sich als Modell für die anspruchsvollsten Coding- und Wissensarbeitsaufgaben in produktiven Umgebungen. Für Unternehmen ergeben sich daraus drei wichtige Implikationen:

Prompt-Strategien überprüfen – Die strengere Instruktionsbefolgung kann bestehende Prompt-Bibliotheken und Agenten-Harnesses brechen. Eine Re-Evaluation lohnt sich vor dem produktiven Rollout.
Kosten-Nutzen sorgfältig kalkulieren – Auf der höchsten Effort-Stufe verbraucht Opus 4.7 erhebliche Token-Mengen. Für viele Routineaufgaben bleiben kleinere Modelle wie Sonnet wirtschaftlicher; Opus sollte gezielt für die schwierigsten 10–20 Prozent der Aufgaben eingesetzt werden.
Safety-Verhalten testen – Die verschärften Filter können legitime Anwendungsfälle blockieren, etwa in der Sicherheitsforschung oder bei datengetriebenen Analysen. Anthropic bietet ein Cyber Verification Program für autorisierte Anwendungsfälle an.

Fazit

Mit Opus 4.7 schließt Anthropic strategisch zur Spitze der Coding-Modelle auf und liefert mit Persistent Memory und hochauflösender Bildverarbeitung gleichzeitig die Grundlagen für anspruchsvollere Agenten-Workflows. Gleichzeitig zeigt der Release: Reine Modell-Verbesserungen reichen nicht mehr aus – das Zusammenspiel mit Tooling, Safety-Architektur und Prompt-Engineering entscheidet, ob das volle Potenzial in Unternehmen ankommt.