Anthropic hat Opus 4.6 Fast Mode als "2.5x schnellere Output-Token-Generierung" angekündigt. Was sie nicht in die Überschrift gepackt haben: Es kostet $30/$150 pro Million Tokens. Standard Opus 4.6 kostet $5/$25.
Das ist 6x teurer. Für 2.5x mehr Speed.
Was Anthropic angekündigt hat
Am 5. Februar 2026 hat Anthropic Opus 4.6 zusammen mit einer "Fast Mode" Research Preview veröffentlicht. Die Ankündigung wurde als Speed-Upgrade für Entwickler geframed, die schnellere Iterationszyklen in Claude Code brauchen.
Der Pitch: gleiches Modell, gleiche Intelligenz, nur schneller. Toggle /fast in Claude Code, bekomm 2.5x schnellere Antworten.
Klingt super. Bis man auf die Rechnung schaut.
Die Pricing-Realität
So sieht Fast Mode im Vergleich zu Standard Opus 4.6 tatsächlich aus:
| Standard Opus 4.6 | Fast Mode | Faktor | |
|---|---|---|---|
| Input | $5 / MTok | $30 / MTok | 6x |
| Output | $25 / MTok | $150 / MTok | 6x |
| Speed | ~71 Tok/s | ~178 Tok/s | 2.5x |
Du zahlst 6x mehr pro Token. Du bekommst 2.5x schnellere Lieferung. Die Kosten-pro-Sekunde für Output sind immer noch 2.4x höher als im Standard-Modus.
Anders gesagt: Für jeden Dollar den du im Standard-Modus ausgibst, verbrennt Fast Mode $6 für die gleiche Arbeit—nur schneller geliefert.
Aber Moment, da ist noch mehr
Fast Mode ist nicht der einzige Kosten-Multiplikator der sich in Opus 4.6 versteckt. Stapel diese auf:
1. Adaptive Thinking = Mehr Tokens Opus 4.6s neuer Adaptive-Thinking-Modus (standardmäßig auf "high" Effort aktiviert) generiert deutlich mehr Output-Tokens als Opus 4.5. Artificial Analysis hat 58M Output-Tokens gemessen um ihren Intelligence Index auf Opus 4.6 mit maximaler Effort zu berechnen—ungefähr 2x was Opus 4.5 brauchte (29M Tokens).
Gleicher Preis pro Token. Doppelt so viele Tokens. Deine Rechnung verdoppelt sich bevor du Fast Mode überhaupt anfasst.
2. Long-Context-Aufpreis Das neue 1M-Token-Kontextfenster nutzen? Jeder Request über 200K Input-Tokens bekommt Premium-Pricing: $10/$37.50 pro MTok. Das ist 2x der Standard-Input-Preis und 1.5x der Output-Preis.
3. US-Only Inference Brauchst du Data Residency in den USA? Addiere einen 1.1x-Multiplikator auf alles.
4. Der Zinseszins-Effekt Stapel Fast Mode + Long Context + US Inference, und ein einzelner API-Call könnte dich kosten:
- Input: $30 × 2 (Long Context) × 1.1 (US) = $66 pro MTok
- Output: $150 × 1.5 (Long Context) × 1.1 (US) = $247.50 pro MTok
Das ist 13.2x mehr auf Input und 9.9x mehr auf Output vs Standard Opus 4.6 mit kurzem Kontextfenster.
Die Real-World-Rechnung
Sagen wir du bist ein Dev der Claude Code 8 Stunden laufen lässt. Konservatives Szenario:
Standard Opus 4.6:
- ~500K Input-Tokens, ~200K Output-Tokens pro Session
- Kosten: ($5 × 0.5) + ($25 × 0.2) = $7.50
Fast Mode:
- Gleiche Arbeit, gleiche Tokens
- Kosten: ($30 × 0.5) + ($150 × 0.2) = $45.00
Das sind $45 vs $7.50 für den gleichen Output. Pro Tag.
Über einen Monat (22 Arbeitstage): $990 vs $165. Fast Mode kostet $825 mehr pro Monat für einen einzelnen Entwickler.
Warum Leute auf X genervt sind
Die Frustration kommt nicht daher, dass Fast Mode existiert. Schnellere Inferenz ist genuinely nützlich für interaktives Debugging und schnelle Iteration. Die Frustration kommt daher, wie es präsentiert wurde.
Anthropics Ankündigung hat mit "2.5x schneller" geführt—der Benefit. Der 6x-Preisanstieg war in Dokumentationsseiten vergraben. Cat Wus Tweet darüber erwähnte "2.5x-faster version" ohne Pricing-Kontext. Die Claude-Code-Docs erwähnen "$30/150 MTok" aber erst nachdem man an Feature-Beschreibungen vorbeigescrollt hat.
Wöchentliche Insights zu AI-Architektur. Kein Spam.
Vergleich das mit wie Anthropic das Opus 4.5 Pricing kommuniziert hat—sie haben mit "67% günstiger" geführt, weil das die gute Nachricht war. Bei Fast Mode ist die gute Nachricht Speed. Die schlechte Nachricht ist der Preis. Rate mal welche den Spotlight bekommen hat.
Der Wettbewerbskontext
Zur Einordnung, hier steht Opus 4.6 Fast Mode im Markt:
| Modell | Output-Preis/MTok | Speed (Tok/s) | $/1K Tokens pro Sekunde |
|---|---|---|---|
| Opus 4.6 Standard | $25 | ~71 | $0.35 |
| Opus 4.6 Fast | $150 | ~178 | $0.84 |
| GPT-5.2 | $15 | ~90 | $0.17 |
| GPT-5.3-Codex | $15 | ~112 | $0.13 |
| Sonnet 4.5 | $15 | ~90 | $0.17 |
Selbst Standard Opus 4.6 ist teuer verglichen mit Wettbewerbern. Fast Mode stellt es in eine eigene Kategorie—und nicht im guten Sinne, kostentechnisch.
GPT-5.3-Codex liefert 58% mehr Speed als Standard Opus bei 60% der Output-Kosten. Es erzielte 77.3% auf Terminal-Bench 2.0 vs Opus 4.6s 65.4%.
Wann Fast Mode tatsächlich Sinn macht
Fairerweise gibt es Szenarien in denen 6x zahlen rational ökonomisch Sinn macht:
Live-Debugging-Sessions wo eine 10-Sekunden-Antwort vs 25-Sekunden-Antwort direkt in Entwickler-Produktivität übersetzt. Wenn dein Entwickler $150/Stunde kostet, sind 15 Extra-Sekunden Wartezeit pro Query über 100 Queries ~25 Minuten Totzeit. Das sind $62.50 in Entwickler-Gehalt vs vielleicht $37 in Extra-API-Kosten.
Demo-Umgebungen wo du flüssige Antworten für Kunden-Präsentationen brauchst.
Zeitkritische Deployments wo 2 Stunden früher shippen mehr zählt als API-Kosten.
Für Async-Workloads, Batch-Processing oder alles was nicht interaktiv ist? Standard-Modus. Immer. Oder nutze Anthropics Batch API für 50% Rabatt.
Das Fazit
Fast Mode ist ein echtes Produkt das ein echtes Problem löst: Opus ist smart aber langsam. Die 2.5x Speed-Verbesserung ist legitim und messbar.
Aber 6x mehr zu verlangen für 2.5x schneller ist eine schlechte Value Proposition für die meisten Entwickler. Und das Pricing zu verstecken während man die Speed-Verbesserung in den Vordergrund stellt, ist die Art von Marketing die Vertrauen erodiert.
Die zusammengesetzten Kosten sind das was wirklich zählt: Adaptive Thinking verbrennt 2x mehr Tokens, Long Context verdoppelt Input-Preise, und jetzt multipliziert Fast Mode alles mit 6. Ein Opus 4.6 Power-User könnte leicht 10-12x die API-Rechnung sehen von jemandem der Opus 4.5 vor drei Monaten genutzt hat—für die gleiche Qualität an Arbeit.
Anthropic baut großartige Modelle. Aber die Pricing-Transparenz könnte etwas von dem "Adaptive Thinking" gebrauchen auf das sie so stolz sind.
Verwandte Artikel: