Przez lata hierarchia Claude była prosta: Haiku do szybkich zadań, Sonnet do większości rzeczy, Opus do najtrudniejszych wyzwań. Teraz nad Opusem pojawił się nowy poziom — Claude Fable 5. Model z ID claude-fable-5, ceną $10/$50 za milion tokenów i zestawem możliwości, który Anthropic wprost określa jako nową erę agentic AI.
Czy to uzasadniony awans, czy tylko droższy Opus? Poniżej sprawdzamy, co faktycznie się zmieniło — od API po benchmarki — i kiedy wyższy koszt ma sens, a kiedy można zostać przy Opus 4.8.
Czym jest Fable 5 — nowy tier, nie kolejna wersja
Kluczowe rozróżnienie: Fable 5 to nie Opus 4.9. To nowy poziom w hierarchii modeli Anthropic, umieszczony powyżej całej rodziny Opus. Praktycznie oznacza to kilka rzeczy:
- Pozycjonowanie: Opus 4.8 pozostaje najlepszym modelem ogólnego przeznaczenia. Fable 5 jest zaprojektowany dla zadań, gdzie granica możliwości ma znaczenie — długohoryzontalne agenty, analiza miliona tokenów kontekstu, najtrudniejszy reasoning.
- Cennik: $10/M input vs $5/M input Opusa 4.8, $50/M output vs $25/M output. Dokładnie 2x droższy w każdym wymiarze.
- Nie jest to upgrade automatyczny: Fable 5 nie zastępuje Opusa. Oba modele istnieją równolegle i będą tak funkcjonować.
Analogia: to jak różnica między dobrym prawnikiem a topowym specjalistą od fuzji i przejęć. Prawnik obsługuje 95% spraw. Specjalista kosztuje 2x więcej i ma sens przy transakcji za 100 milionów.
Zmiany w API — czego nie możesz zignorować
Fable 5 dziedziczy wszystkie breaking changes z Opusa 4.7 i 4.8 (brak temperature, top_p, top_k; tylko adaptive thinking), ale dodaje jedną własną zmianę, która może połamać istniejący kod:
Explicit thinking.disabled = 400
Na Opusie 4.8 możesz napisać thinking: {type: "disabled"} i to zadziała. Na Fable 5 to samo wywołanie zwróci błąd 400. Prawidłowe podejście to po prostu pominąć parametr thinking całkowicie.
// BŁĄD na Fable 5:
{
"model": "claude-fable-5",
"thinking": {"type": "disabled"}, // 400!
"messages": [...]
}
// PRAWIDŁOWO:
{
"model": "claude-fable-5",
"messages": [...]
// brak parametru thinking = thinking wyłączone
}
Jeśli masz routing, który ustawia thinking: {type: "disabled"} jako domyślne, musisz to naprawić przed deployem na Fable 5.
Co zostało bez zmian
- Adaptive thinking:
thinking: {type: "adaptive"}działa tak samo - Effort parameter:
output_config: {effort: "low"|"medium"|"high"|"xhigh"|"max"}— pełna obsługa - Task Budgets: beta
task-budgets-2026-03-13dostępne na obu modelach - Context window: 1M tokenów, identycznie jak Opus 4.8
- Max output: 128K tokenów (wymaga streamingu)
- High-resolution vision: do 2576px na dłuższej krawędzi
- Mid-session system messages: obsługiwane
Nowa funkcja: display: "summarized"
Domyślnie bloki thinking są pomijane w odpowiedzi (pole thinking jest puste). Aby zobaczyć skrócony reasoning:
thinking: {type: "adaptive", display: "summarized"}
Bez tego na interfejsie użytkownika model wygląda jakby "myślał w ciszy" przez długi czas przed odpowiedzią — co jest dezorientujące. Jeśli pokazujesz reasoning użytkownikom, ustaw display: "summarized".
Benchmarki i przypadki użycia — gdzie różnica jest największa
Długi agentic coding (overnight run)
To główny przypadek użycia dla Fable 5. Chodzi o zadania, gdzie agent musi samodzielnie przez wiele godzin: czytać kod, pisać testy, debugować, refaktoryzować, commitować — bez interwencji człowieka.
Opus 4.8 przy wysiłku xhigh radzi sobie dobrze z zadaniami trwającymi 30-60 minut. Fable 5 jest zoptymalizowany pod multi-godzinne sesje z zachowaniem koherencji. Konkretnie: lepsze planowanie długoterminowe (mniejszy drift od pierwotnego celu), rzadsze "zapomnienie" wcześniejszych decyzji architektonicznych, lepsza samokorekta przy napotykaniu błędów.
Jeśli uruchamiasz Claude Code lub własnego agenta coding na 8 godzin z autonomicznym celem — Fable 5 jest właściwym wyborem. Dla zadań 1-2 godzinnych różnica jest mniejsza i Opus 4.8 przy xhigh jest często wystarczający.
Analiza dużych dokumentów (1M context)
Oba modele mają 1M okno kontekstu. Różnica leży w jakości wykorzystania tego kontekstu przy prawdziwym milionie tokenów. Fable 5 wykazuje lepszą precyzję przy pytaniach wymagających integracji informacji z różnych części bardzo długiego dokumentu — mniej "zgubień" powiązań między częściami dokumentu odległymi od siebie o setki tysięcy tokenów.
Dla typowych zastosowań (dokumenty do 200K tokenów) różnica jest marginalna. Przy prawdziwych 800K-1M tokenach — np. całe repozytorium z historią, duży zbiór dokumentów prawnych — Fable 5 ma przewagę.
Kreatywne pisanie i styl
Fable 5 ma cieplejszy, wyraźniejszy głos z mniejszą liczbą AI-izmów. Mniej frazy "Oczywiście, z przyjemnością...", bardziej bezpośrednie, opiniotwórcze teksty. Lepiej radzi sobie z zachowaniem spójnego stylu przez długi dokument.
Dla treści marketingowych, artykułów, e-booków — różnica jest zauważalna. Opus 4.8 również produkuje dobry content, ale wymaga bardziej precyzyjnych instrukcji stylistycznych, żeby utrzymać ton przez całość. Fable 5 "łapie" intencję i trzyma ją lepiej.
Matematyka i rozumowanie
Fable 5 wypada lepiej na trudnych zadaniach matematycznych i logicznych, szczególnie wymagających wielu kroków rozumowania. Kluczowe jest tu słowo "trudnych" — przy standardowych zadaniach (obliczenia, podstawowy reasoning) Opus 4.8 daje identyczne wyniki. Różnica pojawia się przy competition-level math, złożonych dowodach lub zadaniach wymagających exploracji wielu ścieżek rozwiązania.
Code review i debugowanie
Fable 5 jest opisywany przez Anthropic jako model z lepszym code review. W praktyce: wyższy recall przy znajdowaniu bugów (rzadziej "wypuszcza" prawdziwe problemy), lepsze wyjaśnienia przyczyn błędów, trafniejsze sugestie napraw. Dla automatycznych pipeline'ów code review — np. sprawdzanie każdego PR — różnica w jakości może uzasadnić wyższy koszt.
Kiedy Opus 4.8 wystarczy — i można zaoszczędzić 2x
Szczera odpowiedź: w większości przypadków. Oto konkretna lista zadań, gdzie Opus 4.8 przy effort: "high" lub "xhigh" daje porównywalną jakość:
- Zadania Q&A, podsumowania, ekstrakcja danych
- Generowanie kodu dla standardowych problemów
- Analiza dokumentów do 200K tokenów
- Content marketing, blog posty, e-maile
- Agentic tasks trwające do 1-2 godzin
- Zadania z wieloma wywołaniami API (koszt sumuje się szybko przy 2x cenie)
- Prototypowanie i eksperymenty (zanim zaczniesz płacić za Fable 5)
Praktyczna strategia: zacznij od Opusa 4.8. Jeśli wyniki są niezadowalające i podejrzewasz, że to kwestia możliwości modelu (nie promptu), przetestuj Fable 5 na próbce. Jeśli różnica jest wyraźna i uzasadnia 2x koszt — migruj.
Fable 5 vs GPT-5 — różne filozofie
GPT-5 i Fable 5 konkurują w tym samym segmencie, ale z różnymi podejściami:
Fable 5 jest zoptymalizowany pod długie, autonomiczne zadania. Anthropic inwestuje mocno w samokorektę, długohoryzontalne planowanie i bezpieczeństwo przy wysokiej autonomii. Wysiłek (effort) jako parametr to wyraźny sygnał: model jest zaprojektowany do świadomego zarządzania zasobami w długich sesjach.
GPT-5 stawia bardziej na breadth — bardzo szerokie możliwości multimodalne, szybsza integracja z ekosystemem Microsoft/Azure, ściślejsza integracja z narzędziami productivity. Lepsza opcja dla organizacji już głęboko zakorzenionych w Azure.
Praktycznie: jeśli budujesz długo działające agenty autonomiczne — Fable 5. Jeśli potrzebujesz głębokiej integracji z Microsoft 365 lub szerokiego multimodal — GPT-5 może być trafniejszy.
Fable 5 vs Gemini Ultra — porównanie multimodal
Gemini Ultra to najsilniejszy konkurent w kontekście multimodal. Kluczowe różnice:
Vision: Fable 5 obsługuje obrazy do 2576px z wysoką precyzją (koordynaty 1:1 z pikselami). Gemini Ultra ma natywnie silniejsze możliwości wideo i multimodal reasoning (obsługa native video, audio). Jeśli budujesz aplikacje analizujące wideo — Gemini. Jeśli potrzebujesz precyzyjnej analizy obrazów statycznych (computer use, analiza dokumentów) — Fable 5.
Kontekst i agenty: Fable 5 z 1M tokenów i zoptymalizowanym long-horizon reasoning wygrywa przy zadaniach agentic wymagających zachowania koherencji przez długie sesje. Gemini Ultra ma porównywalny kontekst, ale Anthropic ma dłuższą historię w budowaniu bezpiecznych, autonomicznych agentów.
Ekosystem: Google Cloud vs Anthropic API. Dla firm na GCP — Gemini może być prostszą opcją integracji.
Strategia routingu — które zadania do Fable 5, które do tańszych modeli
Realna architektura w produkcji powinna routować zadania inteligentnie:
Warstwa 1: Claude Haiku 4.5 ($1/$5 per MTok)
- Klasyfikacja, tagowanie, proste ekstrakcje
- Walidacja inputów
- Krótkie Q&A z małym kontekstem
- Rate-limited workloads wymagające bardzo niskich kosztów
Warstwa 2: Claude Sonnet 4.6 ($3/$15 per MTok)
- Standardowe generowanie treści
- Analiza dokumentów do 100K tokenów
- Coding tasks niskiej i średniej złożoności
- Większość produkcyjnych workloadów
Warstwa 3: Claude Opus 4.8 ($5/$25 per MTok)
- Złożone reasoning i analiza
- Długie dokumenty (100K-500K tokenów)
- Agentic tasks do 2 godzin
- Zadania wymagające najwyższej jakości tekstu
Warstwa 4: Claude Fable 5 ($10/$50 per MTok)
- Overnight coding runs i złożone refaktory
- Analiza przy prawdziwym 1M kontekście
- Competition-level reasoning
- Zadania, gdzie błąd kosztuje więcej niż 2x cena modelu
Kluczowa zasada: nie defaultuj do Fable 5. Każda warstwa ma swój sweet spot. Dobry routing może obniżyć koszty o 60-80% przy zachowaniu jakości.
ROI dla firm — czy $10/M input to dużo?
Policzmy konkretnie. Typowe enterprise zastosowanie — analiza kontraktów prawnych:
- Kontrakt: 50 stron ≈ 20 000 tokenów input
- Odpowiedź: analiza ryzyk i klauzul ≈ 3 000 tokenów output
- Koszt z Fable 5: 20K × $0,01 + 3K × $0,05 = $0,20 + $0,15 = $0,35 za kontrakt
- Koszt z Opus 4.8: 20K × $0,005 + 3K × $0,025 = $0,10 + $0,075 = $0,175 za kontrakt
Różnica: $0,175 per kontrakt. Jeśli Fable 5 eliminuje chociaż jeden missed risk na 1000 kontraktów, a average ryzyko warte jest $175 — model sam się opłaca. W kontekście usług prawnych (gdzie godzina pracy partnera kosztuje 500-1000 zł) $0,35 to ułamek grosza.
Inny przykład — agentic coding na 8 godzin:
- Szacunkowe zużycie: 2M tokenów input, 500K tokenów output
- Koszt z Fable 5: $20 + $25 = $45 za sesję
- Koszt z Opus 4.8: $10 + $12,50 = $22,50 za sesję
Jeśli Fable 5 kończy zadanie raz zamiast wymagać dwóch sesji z Opusem — jesteś na zero. Jeśli eliminuje potrzebę code review przez seniora (koszt: 2 godziny × 150 zł/h = 300 zł) — Fable 5 jest oczywistym wyborem przy cenie $45.
Jedyna sytuacja, gdy $10/M input jest problematyczna: bardzo duże wolumeny z niską wartością per zadanie. Content generation na masową skalę, klasyfikacja milionów dokumentów, odpowiadanie w czasie rzeczywistym — tu Opus 4.8 lub Sonnet 4.6 są właściwym wyborem ekonomicznym.
Podsumowanie — kiedy który model
Wybierz Fable 5, gdy:
- Budujesz autonomiczne agenty na wielogodzinne zadania
- Pracujesz z prawdziwym 1M kontekstem (800K+ tokenów)
- Jakość wyniku jest krytyczna i trudna do sprawdzenia manualnie
- Błąd kosztuje znacznie więcej niż różnica w cenie modelu
- Testujesz granicę możliwości AI dla najtrudniejszych problemów
Wybierz Opus 4.8, gdy:
- Twoje zadania trwają do 2 godzin lub wymagają standardowej jakości
- Budujesz produkty z dużym wolumenem zapytań
- Chcesz najlepszego modelu ogólnego przeznaczenia bez przepłacania
- Dopiero prototypujesz i chcesz najpierw sprawdzić, czy problem jest rozwiązywalny
- Twój budżet jest ograniczony i każdy złoty ma znaczenie
Fable 5 to realna zmiana jakościowa dla konkretnej klasy zadań — nie marketing. Ale dla większości zastosowań w 2026 roku Opus 4.8 przy effort: "high" to optymalny wybór kosztowo-jakościowy.