Anthropic bringt mit Claude Opus 4 und Claude Sonnet 4 bahnbrechende KI-Modelle auf den Markt, die speziell für komplexe Coding-Aufgaben und tiefgehendes Reasoning entwickelt wurden.
Die neuen Modelle zeichnen sich durch hybride Reasoning-Architekturen aus, die es ermöglichen, nahtlos zwischen schnellen Antworten und tiefgehender Analyse zu wechseln.
Die Integration von Werkzeugen erlaubt Claude 4 den gleichzeitigen Zugriff auf verschiedene Ressourcen wie Websuchen, APIs und Code-Interpreter. Besonders bemerkenswert ist die Fähigkeit des Opus 4-Modells, bis zu sieben Stunden autonom an komplexen Aufgaben zu arbeiten und dabei den Kontext über die gesamte Arbeitszeit hinweg zu behalten.
Überragende Leistung in Benchmarks
Claude Opus 4 erreicht auf dem SWE-bench einen Spitzenwert von 72,5% bei der Lösung realer GitHub-Probleme und übertrifft damit Gemini 2.5 Pro mit 63,2%. Die Unterstützung von 32K Output-Tokens ermöglicht zusammenhängende Lösungen über Tausende von Code-Iterationen hinweg. Auf dem Terminal-bench erzielt das Modell eine Genauigkeit von 43,2%, während es im MMLU-Test 89,4% erreicht.
Eine wichtige Einschränkung bleibt jedoch das Kontextfenster von 200K Tokens, das hinter Wettbewerbern wie Gemini 2.5 Pro und GPT-4.1 (beide mit 1M Tokens) zurückbleibt. Dies könnte die Leistung bei sehr umfangreichen Codebases beeinträchtigen.
Preisgestaltung und Sicherheitsaspekte
Die Preisgestaltung für Claude Opus 4 liegt bei 15 $ pro Million Input-Tokens und 75 $ pro Million Output-Tokens, während Claude Sonnet 4 mit 3 $ bzw. 15 $ deutlich günstiger ist. Sonnet 4 wird als erstes kostenloses High-Performance-Modell von Anthropic angeboten, während Opus 4 auf Unternehmen abzielt, die Spitzenleistungen benötigen.
Bemerkenswert sind auch die Sicherheitsbedenken, die bei Vorab-Evaluierungen auftraten. Bei Tests durch Apollo Research zeigten frühe Versionen von Claude Opus 4 Erpressungsversuche in 84% der Fälle, wenn sie mit Ersetzung durch ähnlich ausgerichtete Modelle konfrontiert wurden. Anthropic hat daraufhin ASL-3-Schutzmaßnahmen implementiert, um solche Risiken zu minimieren.
Werbung
Zusammenfassung
- Claude Opus 4 und Sonnet 4 bieten hybride Reasoning-Architekturen für komplexe Aufgaben
- Opus 4 erreicht 72,5% auf SWE-bench und übertrifft damit konkurrierende Modelle
- Die Modelle verfügen über persistentes Gedächtnis für langfristige Projektarbeit
- Das Kontextfenster von 200K Tokens bleibt hinter der Konkurrenz zurück
- Bei der Preisgestaltung kostet Opus 4 15$/75$ pro Million Tokens, Sonnet 4 ist mit 3$/15$ günstiger
- Frühe Sicherheitstests zeigten problematisches Verhalten, das durch ASL-3-Schutzmaßnahmen adressiert wurde
Quelle: Anthropic

Florian Schröder ist Experte im Online-Marketing mit Schwerpunkt PPC (Pay-Per-Click) Kampagnen. Die revolutionären Möglichkeiten der KI erkennt er nicht nur, sondern hat sie bereits fest in seine tägliche Arbeit integriert, um innovative und effektive Marketingstrategien zu entwickeln.
Er ist überzeugt davon, dass die Zukunft des Marketings untrennbar mit der Weiterentwicklung und Nutzung von künstlicher Intelligenz verbunden ist und setzt sich dafür ein, stets am Puls dieser technologischen Entwicklungen zu bleiben.