Jeśli śledzisz Anthropic od dłuższego czasu, prawdopodobnie myślisz o hierarchii modeli przez pryzmat serii Opus, Sonnet i Haiku. Opus to zawsze był szczyt — najdroższy, najpotężniejszy, dla trudnych zadań. Claude Fable 5 (claude-fable-5) zmienia tę logikę fundamentalnie. To nie jest kolejny Opus. To osobna kategoria ponad nim.
Ten artykuł to przegląd rzeczy, które zaskakują nawet doświadczonych użytkowników API Anthropic — zachowań, ograniczeń projektu i możliwości, które na pierwszy rzut oka wydają się błędami, ale w rzeczywistości są przemyślanymi decyzjami architektonicznymi.
Dlaczego Fable 5 to nie kolejny Opus
Każde poprzednie wydanie flagowego modelu Anthropic to było po prostu "nowy Opus" — Opus 4.5, Opus 4.6, Opus 4.7, Opus 4.8. Fable 5 dostał własną nazwę, i to nieprzypadkowo.
Cennik to najbardziej wymowny sygnał: Opus 4.8 kosztuje $5 za milion tokenów wejściowych i $25 za milion wyjściowych. Fable 5 to $10/$50 — podwójnie droższy w obu kierunkach. To nie jest "trochę lepszy" model sprzedawany za wyższą cenę. To różna jakościowo liga zdolności, szczególnie w zadaniach długohoryzontalnych, autonomicznym kodowaniu i głębokich badaniach.
Kontekstowe okno sięga 1 miliona tokenów — tyle co Opus, ale maksymalny output to 128K tokenów (wymagany streaming). Competes bezpośrednio z GPT-5 i Gemini Ultra, a nie z "poprzednią wersją siebie".
Paradoks: droższy, ale może taniej wypaść
Na początku $10/$50 za milion tokenów boli. Ale spróbuj policzyć inaczej.
Fable 5 jest zoptymalizowany pod długohoryzontalną pracę agentyczną — zadania wymagające wielu iteracji, sprawdzania własnego kodu, głębokiego rozumowania. Na trudnych zadaniach potrafi rozwiązać problem w jednym lub dwóch przejściach, gdzie słabszy model potrzebowałby pięciu lub dziesięciu iteracji z ręcznymi poprawkami.
Przy $5 za milion tokenów × 8 wywołań versus $10 za milion × 2 wywołania — wynik jest porównywalny lub korzystniejszy dla Fable 5, plus zaoszczędzasz czas programisty. Na zadaniach, gdzie liczy się poprawność (code review produkcyjny, złożone refaktoryzacje, długie pętle badawcze), ekonomika przemawia na jego korzyść.
Explicit thinking:disabled zwraca błąd 400 — filozofia projektu
To jest jeden z tych momentów, kiedy programiści migrujący kod z Opus 4.7/4.8 dostają nieoczekiwany 400:
// Na Opus 4.8 - działa
thinking: {type: "disabled"}
// Na Fable 5 - zwraca HTTP 400!
thinking: {type: "disabled"}
Na Opusie 4.8 i 4.7 możesz jawnie wyłączyć thinking. Na Fable 5 samo wysłanie tego parametru z wartością "disabled" jest błędem. Jedyne poprawne podejście to pominięcie parametru thinking całkowicie.
Dlaczego? To nie jest niedopatrzenie — to filozoficzna decyzja projektowa. Fable 5 to model, który z założenia potrafi decydować, kiedy myśleć. Explicit disabled to próba przejęcia kontroli nad czymś, czego model nie chce oddać. Anthropic mówi tym: "nie pytaj nas o wyłączenie thinking, po prostu nie ustawiaj go, a model zadecyduje".
Jedyna forma thinking obsługiwana przez Fable 5 to adaptive:
// Jedyne prawidłowe podejście
thinking: {type: "adaptive"}
// Lub pomiń parametr całkowicie — thinking wyłączony domyślnie
// (nie wysyłaj thinking: {type: "disabled"})
Analogicznie usunięte są parametry temperature, top_p i top_k — wysłanie ich zwraca 400. Fable 5 nie daje użytkownikowi bezpośredniej kontroli nad próbkowaniem.
Adaptive thinking — jak model sam reguluje ile "myśleć"
Na poprzednich modelach (do Opus 4.6 włącznie) extended thinking miało budget_tokens — sam ustawiałeś, ile tokenów model może poświęcić na rozumowanie. Na Fable 5 (i już wcześniej na Opus 4.7/4.8) to pojęcie zniknęło.
Zamiast tego masz effort parameter z poziomami: low, medium, high, xhigh, max. Ale nawet on nie kontroluje bezpośrednio tokenów — mówi modelowi jak bardzo się starać, a model sam decyduje ile to kosztuje.
// Domyślne zachowanie — bez thinking
{
model: "claude-fable-5",
max_tokens: 64000,
messages: [...]
}
// Z adaptive thinking i wysokim effort
{
model: "claude-fable-5",
max_tokens: 64000,
thinking: {type: "adaptive"},
output_config: {effort: "xhigh"},
messages: [...]
}
Co się dzieje pod spodem? Przy trudnym pytaniu matematycznym z effort:max Fable 5 może poświęcić dziesiątki tysięcy tokenów na wewnętrzne rozumowanie. Przy prostym pytaniu — kilkaset lub wcale. Sam budżet przestał być twoim zmartwieniem.
Thinking content jest domyślnie pomijane (bloki thinking są w strumieniu, ale z pustym tekstem). Jeśli chcesz widzieć tok rozumowania w UI lub logach, dodaj display: "summarized":
thinking: {type: "adaptive", display: "summarized"}
Ile tokenów "myśli" przy effort:max
Ktoś kiedyś zapytał: "ile tokenów zużywa thinking Fable 5 na naprawdę trudnym zadaniu?" Odpowiedź zależy, ale na złożonych zadaniach matematycznych lub długich analizach kodu przy effort:max — mówimy o dziesiątkach do ponad stu tysięcy tokenów tylko na thinking.
Dlatego Task Budgets (beta: task-budgets-2026-03-13) to nowe narzędzie dla pętli agentycznych. Możesz powiedzieć modelowi, ile tokenów ma do dyspozycji na cały run — model widzi odliczanie i moderuje się sam:
output_config: {
effort: "high",
task_budget: {type: "tokens", total: 200000}
}
Minimum to 20 000 tokenów. To nie jest twardy limit (jak max_tokens) — to wskazówka dla modelu, jak agresywnie ma pracować.
Claude Code domyślnie używa Fable 5 na effort:xhigh
Jeśli korzystasz z Claude Code (CLI od Anthropic), od momentu wydania Fable 5 domyślnym modelem jest właśnie on — na poziomie effort:xhigh. To nie przypadek.
Poziom xhigh to sweet spot dla zadań kodowania i agentycznych: więcej myślenia niż high, mniej skłonności do overthinkingu niż max. Claude Code jest wzorcem tego, jak Anthropic wyobraża sobie Fable 5 w użyciu — autonomiczne zadania programistyczne, gdzie jakość i poprawność ważniejsza jest niż koszt.
High-resolution vision: 2576px i co to zmienia
Poprzednie modele Anthropic obsługiwały obrazy do 1568px na dłuższym boku. Fable 5 (podobnie jak Opus 4.7, który jako pierwszy wprowadził ten feature) obsługuje do 2576px.
Dla analizy dokumentów to rewolucja. Skan umowy A4 w wysokiej rozdzielczości, screenshot rozbudowanego dashboardu analitycznego, slajd PowerPointa z drobnym drukiem — wszystko to Fable 5 widzi z dokładnością 1:1. Koordynaty wskazywane przez model mapują się bezpośrednio na piksele obrazu.
Koszt: pełnorozdzielcze obrazy zużywają do ~4784 tokenów każdy (poprzednio ~1600). Jeśli nie potrzebujesz tej dokładności, warto skalować kliencko przed wysłaniem.
Warmth i styl pisania — cieplejszy od Opus 4.8
To może wydawać się miękką cechą przy omawianiu modelu AI, ale użytkownicy konsekwentnie to zauważają: Fable 5 pisze cieplej, wyraźniej i z mniejszą ilością hedgingu niż poprzednicy.
Opus 4.8 był bardziej bezpośredni, miejscami nawet suchy. Fable 5 wraca do ciepłego, kolaboratywnego tonu — ale bez AI-clichés, które znasz z gorszych modeli. Mniej "As an AI language model...", więcej rzeczowej pomocy z ludzkim głosem.
Jeśli masz w system promptach instrukcje kompensujące chłodny styl poprzednich Opusów ("Use a warm, collaborative tone"), warto je przeegzaminować — mogą teraz overcorrect.
Dosłowne wykonywanie poleceń — dlaczego to cecha, nie bug
Jeden z bardziej zaskakujących aspektów Fable 5: jest bardzo dosłowny w interpretacji instrukcji. Poproszony o "sprawdź plik X", nie sprawdzi automatycznie powiązanych plików Y i Z. Poproszony o "zmień nazwę zmiennej", nie doda defensive error handling "przy okazji".
Dla nowych użytkowników to frustrating. Dla deweloperów z dopracowanymi promptami to kontrolowana precyzja — model robi dokładnie to, o co prosisz, bez niezamówionych "ulepszeń".
Konsekwencja: instrukcje typu "CRITICAL: YOU MUST use this tool when..." są teraz overtriggering. Fable 5 podąża za system promptem bardzo wiernie. Łagodniejszy język ("Use this tool when it would improve X") działa lepiej i bezpieczniej.
Narracja podczas pracy — i jak ją wyłączyć
Fable 5 narruje więcej niż poprzednicy. Między wywołaniami narzędzi pisze więcej tekstu, podsumowania po zadaniach są dłuższe i bardziej szczegółowe. Na interaktywnych produktach kodowania to wartość dodana — użytkownik wie, co się dzieje.
Na agentycznych pętlach backendowych, gdzie chcesz ciszy między wywołaniami, można to wyciszyć explicit instrukcją w system promptcie:
"Default to silence between tool calls. Only write text when you find something, change direction, or hit a blocker — one sentence each. Do not narrate routine actions. When done: one or two sentences on the outcome."
Fable 5 podąży za tą instrukcją precyzyjnie — pamiętaj o dosłowności opisanej powyżej.
Bardziej deliberatywny — pyta częściej niż Opus 4.8
Fable 5 jest bardziej deliberatywny. Na niejednoznacznych zadaniach zamiast robić założenie i iść do przodu, częściej zapyta o potwierdzenie. Po zakończeniu zadania częściej kończy pytaniem "Want me to also...?" zamiast po prostu zatrzymać się.
Dla produktów z wieloma interakcjami użytkownika to może być drażniące. Złoty środek to explicit autonomy grant przy małych decyzjach:
"For minor choices (naming, formatting, default values), pick a reasonable option and note it rather than asking. For scope changes or destructive actions, still ask first."
Porównanie z GPT-5 i Gemini Ultra
Gdzie Fable 5 wygrywa:
- Długohoryzontalny kod i refaktoryzacje — autonomiczne uruchomienia bez ludzkiej korekcji, gdzie inne modele gubią kontekst po kilkudziesięciu krokach
- Code review — wyższa recall przy znajdowaniu bugów, wyższa precision przy raportowaniu; GPT-5 i Gemini częściej hallucynują fałszywe pozytywy lub gubią rzeczywiste problemy
- Długi kontekst (1M tokenów) — rzeczywista zdolność do pracy z milionem tokenów, a nie tylko nominalna obsługa
- Styl pisania długich dokumentów — Fable 5 pisze raporty i dokumentację na poziomie bliższym ludzkiemu ekspertowi, bez typowych AI artefaktów
- Bezpieczeństwo instrukcji — bardziej przewidywalny, mniej podatny na prompt injection w złożonych pipeline'ach
Gdzie Fable 5 przegrywa lub jest równy:
- Koszt na proste zapytania — dla klasyfikacji, prostych ekstrakcji czy szybkich odpowiedzi Q&A, Sonnet 4.6 lub Haiku 4.5 wygrywają ekonomicznie
- Latency na krótkich zadaniach — GPT-5 i Gemini mogą być szybsze na prostych zapytaniach bez thinking
- Ekosystem narzędzi — OpenAI i Google mają rozbudowniejsze integracje first-party z chmurami publicznymi; Managed Agents od Anthropic jest mocny, ale młodszy
Praktyczne wskazówki migracyjne
Jeśli masz kod działający z Opus 4.8, to lista zmian wymaganych do przejścia na Fable 5:
- Zmień model ID na
claude-fable-5 - Usuń
thinking: {type: "disabled"}jeśli go używasz — pomiń parametr zamiast go ustawiać - Upewnij się, że nie wysyłasz
temperature,top_p,top_k(400 jeśli je wyślesz) - Zachowaj adaptive thinking (
{type: "adaptive"}) — działa identycznie - Rozważ effort:xhigh dla zadań kodowania zamiast dotychczasowego effort:high
- Przejrzyj system prompty pod kątem agresywnych instrukcji — Fable 5 jest bardziej posłuszny
Fable 5 to nie upgrade Opusa. To inna kategoria narzędzia — droższa, potężniejsza, zaprojektowana pod autonomiczne systemy agentyczne i zadania, gdzie poprawność na pierwszym uruchomieniu jest warta premium.