Claude Fable 5 to nie kolejna wersja Opusa — to zupełnie nowa kategoria. Model z oknem kontekstowym 1 miliona tokenów, ceną $10/$50 za milion tokenów i architekturą zorientowaną na długoterminową, autonomiczną pracę agentową. Brzmi drogo? Dla większości zadań jest. Ale dla konkretnych zastosowań — tych, gdzie słabszy model po prostu zawiedzie — Fable 5 zwraca się kilkukrotnie.
Poniżej 10 aplikacji, które możesz zacząć budować już teraz. Dla każdej: po co Fable 5 (nie Sonnet, nie Haiku), jak wygląda kluczowy fragment architektury i ile to będzie kosztować miesięcznie przy realnym użyciu.
1. Autonomiczny agent kodowania (overnight coding)
Podajesz specyfikację wieczorem. Rano masz kod — przetestowany, z dokumentacją, gotowy do code review. Nie "jakiś kod", tylko pełna implementacja zgodna z architekturą projektu.
Dlaczego Fable 5
Kluczowa jest kombinacja: adaptacyjne myślenie (thinking: {type: "adaptive"}), długie okno kontekstu (cały projekt wchodzi naraz) i effort xhigh — ten sam, którego używa Claude Code domyślnie. Słabsze modele gubią kontekst przy dużych codebases. Fable 5 utrzymuje spójność przez setki narzędzi wywołanych w jednej sesji.
Architektura
POST /v1/messages
{
"model": "claude-fable-5",
"max_tokens": 128000,
"output_config": {"effort": "xhigh"},
"thinking": {"type": "adaptive", "display": "summarized"},
"tools": [
{"type": "bash_20250124", "name": "bash"},
{"type": "text_editor_20250728", "name": "str_replace_based_edit_tool"},
{"type": "web_search_20260209", "name": "web_search"}
],
"messages": [{"role": "user", "content": "Zaimplementuj moduł płatności Stripe..."}]
}Task Budget beta (task-budgets-2026-03-13) pozwala modelowi wiedzieć, ile tokenów ma na całą sesję — sam racjonuje zasoby i nie rozpisuje się tam, gdzie nie trzeba.
Koszt miesięczny
Przy 5 dużych sesjach kodowania tygodniowo (średnio 200k tokenów input + 50k output każda): około $450-600/mies.. Dla firmy, która płaci programiście za nocne nadgodziny — opłacalne.
2. Deep Research Engine
Agent, który przeszukuje sieć, czyta 50-100 źródeł, syntetyzuje wiedzę i produkuje raport z przypisami. Nie lista linków — analityczny dokument gotowy do publikacji lub do podejmowania decyzji.
Dlaczego Fable 5
Raport z 100 źródeł po summaryzacji zajmuje kilkaset tysięcy tokenów w kontekście. Żaden model z oknem 200k tego nie udźwignie bez tracenia początku. Fable 5 ma 1M tokenów — cały research mieści się naraz, bez chunking i bez utraty kontekstu między iteracjami.
Architektura
- Faza 1: agent generuje listę pytań badawczych, szuka każdego przez
web_search_20260209 - Faza 2: pobiera treść znalezionych stron przez
web_fetch_20260209, ładuje do kontekstu - Faza 3: jeden duży prompt syntezy — wszystkie źródła naraz, pytanie o strukturę raportu
{
"model": "claude-fable-5",
"max_tokens": 128000,
"output_config": {"effort": "high"},
"tools": [
{"type": "web_search_20260209", "name": "web_search"},
{"type": "web_fetch_20260209", "name": "web_fetch"}
],
"system": "Jesteś analitykiem badawczym. Syntetyzuj wszystkie dostarczone materiały...",
"messages": [{"role": "user", "content": "[zebrane_źródła]\n\nNapisz raport..."}]
}Koszt miesięczny
50 raportów miesięcznie (średnio 400k tokenów input + 30k output): $280-400/mies.. Jako SaaS dla firm konsultingowych — wyceniasz 10x więcej.
3. Analizator umów prawnych
Wrzucasz umowę (nawet 200-stronicową), orzecznictwo sądowe i wytyczne regulacyjne. Agent wskazuje ryzyka, niejasności i klauzule wymagające negocjacji. Nie zamiast prawnika — jako przygotowanie dla prawnika, które skraca jego czas pracy 3-5x.
Dlaczego Fable 5
Okno 1M tokenów to około 750 000 słów tekstu. Cała umowa + orzecznictwo + komentarze doktrynalne wchodzą w jeden prompt. Przy mniejszych modelach musisz dzielić dokumenty i tracisz odniesienia między sekcjami. Tu masz całość naraz — model widzi sprzeczności między paragrafem 3.2 a załącznikiem F, bo oba są w kontekście jednocześnie.
Architektura
{
"model": "claude-fable-5",
"max_tokens": 64000,
"output_config": {
"effort": "high",
"format": {
"type": "json_schema",
"schema": {
"type": "object",
"properties": {
"ryzyka": {"type": "array", "items": {"type": "object",
"properties": {
"klauzula": {"type": "string"},
"poziom_ryzyka": {"type": "string", "enum": ["niski", "sredni", "wysoki"]},
"opis": {"type": "string"}
}
}},
"rekomendacje": {"type": "array", "items": {"type": "string"}}
}
}
}
},
"messages": [{"role": "user", "content": "[UMOWA]\n[ORZECZNICTWO]\n\nAnaliza ryzyk..."}]
}Koszt miesięczny
100 analiz umów (średnio 300k tokenów input + 10k output): $350-500/mies.. Kancelaria prawna zaoszczędza dni pracy — margin jest ogromny.
4. AI-Powered Code Reviewer z rubryką
Nie "sprawdź czy kod działa", tylko outcome-based grading: kod jest oceniany według konkretnych kryteriów — bezpieczeństwo, pokrycie testami, zgodność z konwencjami projektu, wydajność. Wynik: lista znalezisk z poziomem pewności i wagą.
Dlaczego Fable 5
Fable 5 ma lepszy code review niż jakikolwiek poprzedni model — wyższą precyzję i recall przy znajdowaniu bugów. Co ważniejsze: przy effort high raportuje wszystkie znaleziska z confidence level, a nie filtruje po ważności. To kluczowe dla narzędzi CI/CD, gdzie chcesz pełne pokrycie, a ranking robisz downstream.
Architektura
Używasz Task Budgets, żeby model wiedział, ile ma tokenów na review całego PR:
{
"model": "claude-fable-5",
"max_tokens": 64000,
"output_config": {
"effort": "high",
"task_budget": {"type": "tokens", "total": 200000}
},
"system": "Raportuj każde znalezisko z polem confidence (0-1) i severity. Nie filtruj po ważności.",
"messages": [{"role": "user", "content": "[DIFF]\n[REGUŁY_PROJEKTU]\n\nCode review..."}]
}Koszt miesięczny
500 PR reviews (średnio 80k tokenów input + 5k output): $650-800/mies.. Jako plugin do GitHub Actions lub GitLab CI — wyceniasz per-seat.
5. Autonomiczny asystent email
Agent czyta skrzynkę, kategoryzuje wiadomości według priorytetów, dla każdej przygotowuje projekt odpowiedzi zgodny z Twoim stylem komunikacji. Nie wysyła bez zatwierdzenia — ale draft jest gotowy, często wymaga tylko kliknięcia "wyślij".
Dlaczego Fable 5
Fable 5 jest bardziej deliberatywny niż poprzednie modele — pyta częściej przy niejednoznacznych przypadkach. To akurat zaleta przy asystencie email: woli zapytać przed wysłaniem projektu odpowiedzi na ważnego klienta niż zgadywać. Adaptacyjne myślenie pozwala mu oceniać kontekst każdej wiadomości (historia wątku, relacja z nadawcą) bez dodatkowych promptów.
Architektura
Multi-agent pipeline z Managed Agents API:
- Agent 1: klasyfikator (Haiku 4.5) — sortuje email do kategorii
- Agent 2: Fable 5 — dla wiadomości oznaczonych jako "wymaga odpowiedzi", czyta historię wątku i pisze draft
- Custom tool:
get_email_history(thread_id)— pobiera historię wątku z Twojego klienta email
// Custom tool w sesji agenta
{
"type": "custom",
"name": "get_email_history",
"description": "Pobierz historię wątku email. Wywołaj gdy potrzebujesz kontekstu poprzednich wiadomości.",
"input_schema": {
"type": "object",
"properties": {"thread_id": {"type": "string"}},
"required": ["thread_id"]
}
}Koszt miesięczny
200 wiadomości wymagających odpowiedzi (klasyfikacja: Haiku, drafty: Fable 5, średnio 20k tokenów per draft): $150-250/mies. Klasyfikator na Haiku jest tani, Fable 5 tylko tam, gdzie naprawdę potrzeba.
6. Generator prezentacji z danych
Wrzucasz plik Excel z wynikami sprzedaży. Dostajesz PowerPoint z analizą trendów, wykresami i rekomendacjami — gotowy do prezentacji zarządowi. Nie szablon z danymi, tylko narracja analityczna.
Dlaczego Fable 5
Fable 5 ma wbudowany skill PPTX (przez Managed Agents). Rozumie strukturę prezentacji, dobiera kolejność slajdów, pisze narrację spójną przez cały deck. Przy kodzie generującym wykresy (przez code_execution_20260120) i skilu PPTX dostaje pełną autonomię: od surowych danych do finalnego pliku.
Architektura
// Agent z skills PPTX i code execution
agent = client.beta.agents.create(
name="Presentation Generator",
model="claude-fable-5",
skills=[{"type": "anthropic", "skill_id": "pptx"}],
tools=[
{"type": "agent_toolset_20260401"},
{"type": "code_execution_20260120", "name": "code_execution"}
]
)
// W sesji: mount pliku Excel, kickoff z opisem odbiorców i celu
session = client.beta.sessions.create(
agent=agent.id,
environment_id=env_id,
resources=[{"type": "file", "file_id": excel_file_id, "mount_path": "/workspace/data.xlsx"}]
)Koszt miesięczny
50 prezentacji miesięcznie (średnio 100k tokenów input + 30k output + code execution): $200-350/mies.
7. Multi-agent pipeline do content marketingu
Jeden brief wchodzi, wychodzi: artykuł SEO, posty na LinkedIn i Twitter, newsletter, brief dla grafika. Każdy element zgodny z brand voice, zoptymalizowany pod odpowiedni kanał, gotowy do publikacji.
Dlaczego Fable 5
Fable 5 ma "silniejszy głos" niż Opus 4.8 — cieplejszy, bardziej bezpośredni, bez hedgingu. Dla content marketingu to istotna różnica. Jako koordynator multi-agent pipeline zarządza subagentami (per kanał komunikacji), utrzymując spójność brand voice przez cały pipeline.
Architektura
// Coordinator z subagentami per kanał
agent = client.beta.agents.create(
name="Content Coordinator",
model="claude-fable-5",
system="Koordynujesz produkcję contentu. Brand voice: [OPIS]. Deleguj per kanał.",
multiagent={
"type": "coordinator",
"agents": [
article_agent_id, // Sonnet 4.6 — długie formy
social_agent_id, // Haiku 4.5 — krótkie posty
newsletter_agent_id // Sonnet 4.6 — email
]
}
)Coordinator na Fable 5, subagenci na tańszych modelach — płacisz za intelligence tylko tam, gdzie jest potrzebna.
Koszt miesięczny
40 kampanii (1 brief → 4 formaty): coordinator ~20k tokenów, subagenci ~150k tokenów łącznie na Sonnet/Haiku: $180-280/mies.
8. Debugger legacy kodu
Ładujesz cały projekt (50k-200k linii kodu), opisujesz bug lub zachowanie, które chcesz zmienić. Agent rozumie architekturę, lokalizuje przyczynę i proponuje fix z wyjaśnieniem, dlaczego akurat to miejsce i dlaczego to rozwiązanie.
Dlaczego Fable 5
Legacy codebase to setki plików wzajemnie się referencjonujących. Przy małym oknie kontekstu musisz zgadywać, które pliki są relevantne. Przy 1M tokenach ładujesz wszystko i pozwalasz modelowi samemu znaleźć połączenia. Fable 5 rozumie długie łańcuchy zależności, które gubią mniejsze modele.
Architektura
Używasz prompt caching dla stabilnej części codebase — płacisz za zapis raz, potem każde zapytanie korzysta z cache:
{
"model": "claude-fable-5",
"max_tokens": 64000,
"system": [
{
"type": "text",
"text": "[CAŁY_CODEBASE_500K_TOKENÓW]",
"cache_control": {"type": "ephemeral", "ttl": "1h"}
}
],
"messages": [{"role": "user", "content": "Bug: NullPointerException w linii 347..."}]
}Pierwsze zapytanie: pełny koszt. Kolejne w ciągu godziny: cache read (~0.1x ceny) — istotna oszczędność przy iteracyjnym debugowaniu.
Koszt miesięczny
20 sesji debugowania (500k tokenów input per sesja, z cache: skutecznie ~50k + 10k output): $200-400/mies.
9. Asystent badań naukowych
Wrzucasz 50 artykułów naukowych (PDF). Agent syntezuje stan wiedzy, identyfikuje sprzeczności między badaniami, wskazuje luki i generuje sekcję "Related Work" gotową do manuskryptu. Ze wszystkimi przypisami.
Dlaczego Fable 5
High-resolution vision do 2576px — tabele i wykresy z artykułów są odczytywane precyzyjnie. 1M okno kontekstu — 50 artykułów po 20 stron każdy wchodzi naraz. Adaptacyjne myślenie na poziomie high — model naprawdę analizuje metodologię, a nie tylko streszcza abstrakty.
Architektura
// Upload artykułów przez Files API, referencja w wiadomości
uploaded_files = [client.beta.files.upload(file=open(f, "rb")) for f in papers]
messages = [{
"role": "user",
"content": [
{"type": "text", "text": "Przeanalizuj te artykuły i napisz syntezę literatury..."},
*[
{"type": "document", "source": {"type": "file", "file_id": f.id}}
for f in uploaded_files
]
]
}]
response = client.beta.messages.create(
model="claude-fable-5",
max_tokens=128000,
output_config={"effort": "high"},
messages=messages,
betas=["files-api-2025-04-14"]
)Koszt miesięczny
20 przeglądów literatury (50 artykułów każdy, ~600k tokenów input + 30k output): $750-1000/mies.. Dla lab badawczego oszczędza tygodnie pracy doktorantów.
10. Personal AI Coach z pamięcią długoterminową
Coach, który pamięta wszystkie poprzednie rozmowy, Twoje cele, postępy i preferencje komunikacji. Nie zaczyna od nowa przy każdej sesji — buduje na fundamencie historii i dostosowuje podejście do tego, co już wie o Tobie.
Dlaczego Fable 5
Fable 5 jest bardziej deliberatywny — pyta gdy coś jest niejednoznaczne, nie zgaduje. To dokładnie to, czego chcesz od coacha. Memory Stores w Managed Agents API pozwalają na persistentną pamięć między sesjami bez żadnego dodatkowego kodu po Twojej stronie.
Architektura
# Jednorazowe stworzenie memory store i agenta
memory_store = client.beta.memory_stores.create(
name="user_123_coaching_memory",
description="Cele, postępy, preferencje i historia sesji coachingowych użytkownika."
)
agent = client.beta.agents.create(
name="Personal Coach",
model="claude-fable-5",
system="""Jesteś osobistym coachem. Przed każdą sesją sprawdź pamięć pod /mnt/memory/coaching/.
Notuj nowe ustalenia, postępy i zmiany celów. Buduj na tym, co już wiesz.""",
tools=[{"type": "agent_toolset_20260401"}]
)
# Każda sesja: mount memory store
session = client.beta.sessions.create(
agent=agent.id,
environment_id=env_id,
resources=[{
"type": "memory_store",
"memory_store_id": memory_store.id,
"access": "read_write",
"instructions": "Tutaj jest historia coachingu. Czytaj przed sesją, zapisuj po."
}]
)Koszt miesięczny
100 użytkowników, 2 sesje tygodniowo każdy (średnio 30k tokenów per sesja): $500-700/mies. Jako subscription per user: 100 × $15/mies = $1500 przychodu przy ~$600 kosztu modelu.
Jak dobierać effort i kiedy używać Fable 5
Fable 5 nie jest dla wszystkiego. Reguła prosta:
- Używaj Fable 5, gdy zadanie wymaga: długiego kontekstu (>200k tokenów), wielogodzinnej autonomicznej pracy, złożonego rozumowania przez wiele kroków lub gdy quality matters more than cost
- Używaj Sonnet/Haiku dla: klasyfikacji, prostych ekstrakcji, generowania krótkich treści, subagentów w pipeline gdzie robota jest rutynowa
- Effort:
xhighdla kodowania i pracy agentowej,highjako rozsądny default,mediumgdy koszt ma znaczenie,lowdla subagentów i zadań prostych
Każda z powyższych aplikacji ma jeden wspólny mianownik: są to zadania, przy których słabszy model nie zawiedzie spektakularnie — zawiedzie po cichu, produkując pozornie sensowny output, który okazuje się błędny dopiero przy dokładnej analizie. Fable 5 kosztuje więcej, ale redukuje ten konkretny rodzaj ryzyka.