Raw Record Source

{
  "$type": "site.standard.document",
  "bskyPostRef": {
    "cid": "bafyreigbaghuscerhmg2n2g7dfeukdviquh2fdvwkrqxh7xul5ah3hyw7y",
    "uri": "at://did:plc:jcdhsk6w7rxuehjvjgwrwr7d/app.bsky.feed.post/3mpjolvgm4a62"
  },
  "coverImage": {
    "$type": "blob",
    "ref": {
      "$link": "bafkreie2h55qrs37zipifgurm3ioukqa4dm2p7wvuax3iw7maqcnsqjj5a"
    },
    "mimeType": "image/webp",
    "size": 104264
  },
  "description": "Anthropic hat Claude Sonnet 5 veröffentlicht: agentischer als der Vorgänger, bei einzelnen Benchmarks auf Opus-4.8-Niveau und günstiger. Der neue Tokenizer frisst den Preisvorteil aber teilweise wieder auf. Eine nüchterne Einordnung, kurz nach Launch.\n",
  "path": "/ki-news/claude-sonnet-5-agentisch-naeher-an-opus-mit-token-haken-beim-preis/",
  "publishedAt": "2026-06-30T18:56:51.000Z",
  "site": "https://t01.li",
  "tags": [
    "Claude Sonnet 5, von Anthropic heute, am 30. Juni, veröffentlicht",
    "Opus 4.8"
  ],
  "textContent": "_Claude Code_ hat heute Abend an meinem Ghost-Theme weitergewerkelt, und ich hätte den Modellwechsel fast verschlafen. Erst eine Zeile im Terminal hat mich darauf gestoßen, dass da seit ein paar Minuten ein anderes Modell die Tasten führt. Claude Sonnet 5, von Anthropic heute, am 30. Juni, veröffentlicht – als das bislang agentischste Modell der Sonnet-Reihe.\n\nGut 30 Minuten nach Launch habe ich noch kein belastbares Urteil über die Qualität. Was ich habe, ist die Pressemitteilung – und die lohnt einen zweiten Blick, bevor man die Zahlen für bare Münze nimmt.\n\n##  TL;DR\n\nAnthropic hat Claude Sonnet 5 veröffentlicht – das bislang agentischste Sonnet, ab sofort Standardmodell für Free und Pro.\n\n  * Bei „Humanity’s Last Exam“ (mit Tools) und GDPval-AA v2 liegt Sonnet 5 praktisch auf Opus-4.8-Niveau, beim harten Coding bleibt Opus vorn.\n  * Einführungspreis: 2 / 10 US-Dollar pro Million Token (In/Out) bis 31. August, danach 3 / 15.\n  * Haken: Der neue Tokenizer mappt denselben Input auf bis zu das 1,35-Fache an Token – gegenüber dem Vorgänger Sonnet 4.6, nicht gegenüber Opus. Anthropic nennt den Umstieg „ungefähr kostenneutral“ – aber nur bis 31. August.\n  * Alle Leistungszahlen sind herstellereigen, eine unabhängige Drittmessung gibt es noch nicht.\n\n\n\n## Was Anthropic da rausgehauen hat\n\nDer Pitch ist schnell erzählt. _Sonnet 5_ soll planen, Tools wie Browser und Terminal bedienen und länger autonom durcharbeiten, als es bei einem Sonnet bisher drin war. Anthropic verkauft das als Annäherung an die teurere Opus-Klasse – die Leistung liege nah an Opus 4.8, der Preis aber deutlich darunter.\n\nVerfügbar ist das Modell ab sofort über alle Pläne. Für Free und Pro ist es das neue Standardmodell, Max-, Team- und Enterprise-Nutzer bekommen es ebenfalls. In _Claude Code_ und über die Claude-Plattform läuft es unter dem API-Namen `claude-sonnet-5`. Die Rate-Limits hat Anthropic über Chat, _Cowork_ , _Claude Code_ und Plattform angehoben, weil höhere Effort-Level mehr Token fressen.\n\n## Der Preis sieht nach Rabatt aus – bis du das Sternchen liest\n\nHier wird es interessant. Zum Start kostet  _Sonnet 5_ 2 US-Dollar pro Million Input-Token und 10 US-Dollar pro Million Output-Token, und zwar bis zum 31. August. Danach geht es auf 3 beziehungsweise 15 US-Dollar hoch. Zum Vergleich:  _Opus 4.8_ liegt bei 5 und 25 US-Dollar. Auf dem Papier ein hübscher Abstand nach unten – und der bleibt auch echt, dazu gleich. Das Sternchen steht nämlich woanders.\n\nEs steht in Fußnote zwei:  _Sonnet 5_ bringt einen neuen Tokenizer mit, wie schon  _Opus 4.7_ , und derselbe Input mappt jetzt auf mehr Token – je nach Inhalt das 1,0- bis 1,35-Fache. Anthropic schreibt selbst, der Einführungspreis sei so gesetzt, dass der Umstieg ungefähr kostenneutral ausfällt. Übersetzt heißt das: Wer sein bisheriges _Sonnet 4.6_ -Budget auf _Sonnet 5_ hochrechnet und die Token-Zahl konstant lässt, verkalkuliert sich – nicht gegen Opus, sondern gegen sein eigenes Vorher.\n\nRechnen wir es mal durch: derselbe Text, Input-Seite, im ungünstigsten Fall 1,35× so viele Token. Zum Einführungspreis von 2 US-Dollar landest du bei rund 2,70 statt der 3 US-Dollar auf _Sonnet 4.6_ – eine Spur günstiger, daher das „kostenneutral“. Ab dem 1. September steht der Zähler bei 3 US-Dollar mal 1,35, macht gut 4 US-Dollar für exakt denselben Input. Bis zu 35 Prozent über dem, was _Sonnet 4.6_ vorher gekostet hat.\n\n## Benchmarks: die Lücke schrumpft\n\nJetzt mit Zahlen. Anthropic stellt  _Sonnet 5_ gegen den Vorgänger  _Sonnet 4.6_ und das teurere  _Opus 4.8_ :\n\nBenchmark | _Sonnet 5_ | _Sonnet 4.6_ | _Opus 4.8_\n---|---|---|---\nSWE-bench Pro (Coding) | 63,2 % | 58,1 % | 69,2 %\nTerminal-Bench 2.1 (Coding) | 80,4 % | 67,0 % | 82,7 %\nHumanity’s Last Exam, ohne Tools | 43,2 % | 34,6 % | 49,8 %\nHumanity’s Last Exam, mit Tools | 57,4 % | 46,8 % | 57,9 %\nOSWorld-Verified (Computer-Use) | 81,2 % | 78,5 % | 83,4 %\nGDPval-AA v2 (Knowledge Work, Score) | 1.618 | 1.395 | 1.615\n\nZwei Werte stechen raus. Bei „Humanity’s Last Exam“ mit Tools liegt _Sonnet 5_ mit 57,4 Prozent praktisch auf _Opus 4.8_ -Niveau (57,9 Prozent) – ein halber Punkt Abstand. Und bei GDPval-AA v2 steht das billigere Modell mit 1.618 sogar minimal über dem teuren Opus (1.615). Die „Annäherung an Opus“ ist hier keine PR-Phrase mehr, sondern steht in der Tabelle.\n\nBevor jetzt jemand „ _Sonnet 5_ schlägt  _Opus_ “ titelt, ein Einordnungs-Dämpfer: Drei Punkte auf einer 1.600er-Skala sind Rauschen, keine Überlegenheit – das ist ein Gleichstand, kein Thronwechsel. Beim harten Coding bleibt _Opus_ vorn: Bei SWE-bench Pro trennen die beiden sechs Punkte, das merkt man in der Praxis. Der größte Sprung gegenüber _Sonnet 4.6_ steckt in Terminal-Bench 2.1, plus 13 Punkte – da hat sich beim agentischen Arbeiten am Terminal wirklich etwas getan.\n\nUnd der Sternchen-Charakter bleibt. Es sind Anthropics eigene Messungen, eine knappe halbe Stunde nach Launch gibt es keine unabhängige Drittmessung. Wie beweglich diese Werte sind, zeigt Anthropic selbst: Die alten _Sonnet 4.6_ -Zahlen wurden nachträglich neu bewertet, weil sich der Grader geändert hat. Andere Methodik, andere Zahl für dasselbe Modell. Launch-Benchmarks taugen zur Orientierung, nicht als Naturkonstante.\n\nDie zehn Partner-Zitate im Beitrag laufen in dieselbe Richtung – mehr agentisch, führt Tasks zu Ende, prüft sich unaufgefordert selbst. Schön zu lesen, aber es sind handverlesene Early-Access-Stimmen in einem Marketing-Text. Ich werte sie als das.\n\n## Sicherheit: die Cyber-Bremse ist ab Werk an\n\nDer nüchternste Teil der Mitteilung ist der ehrlichste. Im Behavioral Audit schneidet _Sonnet 5_ insgesamt sicherer ab als _Sonnet 4.6_ , halluziniert weniger und schleimt weniger. Gegen _Opus 4.8_ und das _Mythos Preview_ zeigt es allerdings eine höhere Rate an Fehlausrichtung – das kleinere Modell ist eben kein Sicherheits-Selbstläufer.\n\nBeim Thema „Cyber“ wird Anthropic konkret. Trainiert wurde _Sonnet 5_ darauf nicht. In einer mit Mozilla entwickelten Eval sollten Modelle Exploits für Lücken in _Firefox_ 147 bauen – _Sonnet 5_ schaffte in keinem Fall einen voll funktionsfähigen Exploit, lag bei den Teilerfolgen aber minimal über _Sonnet 4.6_. Anthropic führt das auf die gestiegene Allgemein-Intelligenz zurück, nicht auf gezieltes Training. Konsequenz: Die Cyber-Safeguards sind standardmäßig aktiv, dieselben wie bei _Opus 4.7_ und _4.8_. Ein Modell, das beim Bauen von Angriffs-Code besser werden könnte, kriegt vorsorglich einen Riegel vorgeschoben. Das ist die vernünftige Variante.\n\n### Mein Take dazu\n\nWenn man mich fragt ist die eigentliche Nachricht daran das Preisschild. Agentische Fähigkeiten, die bei „Humanity’s Last Exam“ mit Tools und bei GDPval auf Opus-Höhe liegen, aber im günstigeren Sonnet-Bereich – das ändert die Rechnung für alle, die Agenten in Masse laufen lassen. Genau da lohnt der zweite Blick: Gegen Opus ist der Preisvorteil sauber, beide zählen Token gleich. Das Sternchen greift gegenüber dem Vorgänger – und nur bis Ende August. Danach zahlst du für denselben Input eher mehr als auf _Sonnet 4.6_. Das gibt Anthropic selbst zu, man muss es nur lesen. Und beim reinen Coding ist Opus weiter das schärfere Werkzeug, wenn auch nicht mehr mit großem Vorsprung.\n\nBleibt der Rest: herstellereigene Zahlen, kuratierte Lob-Zitate, null unabhängige Daten. Ob die agentischen Sprünge im echten, chaotischen Alltag halten, zeigt sich erst in den nächsten Tagen – nicht in einer Launch-Grafik. Der stille Modellwechsel in meinem Terminal ist dabei das Bild, das hängen bleibt. Diese Modelle schieben sich inzwischen unter dir durch, ohne dass du es merkst. Praktisch. Und ein bisschen unheimlich.",
  "title": "Claude Sonnet 5 ist da – näher an Opus, aber mit Sternchen beim Preis",
  "updatedAt": "2026-07-01T08:39:04.853Z"
}