„Ten tekst na 98% napisała sztuczna inteligencja". Takie zdanie potrafi dziś zakończyć współpracę z copywriterem, oblać studenta albo zniszczyć reputację dziennikarza. Problem w tym, że żaden detektor AI nie mierzy faktu — mierzy prawdopodobieństwo. I robi to na tyle zawodnie, że nawet OpenAI, firma, która wywołała całe zamieszanie, wycofała własny klasyfikator po pół roku. W tym artykule rozbieramy detektory na części: jak działają, ile naprawdę się mylą, kogo krzywdzą najczęściej i co z tym wszystkim robi unijne prawo.
Jak detektor „widzi" maszynę: perplexity i burstiness
Klasyczne detektory (tak działa m.in. GPTZero w swojej pierwotnej wersji) opierają się na dwóch statystycznych sygnałach.
Perplexity (zaskoczenie modelu) mierzy, jak przewidywalny jest tekst dla modelu językowego. Modele AI generują słowa, wybierając te najbardziej prawdopodobne — więc tekst maszynowy jest „gładki" i mało zaskakujący. Człowiek pisze chaotyczniej: wtrąca dygresje, używa rzadkich słów, popełnia nietypowe błędy. Niska perplexity = podejrzenie AI.
Burstiness (nierówność rytmu) patrzy na zmienność zdań. Ludzie piszą falami: długie, wielokrotnie złożone zdanie, potem trzy słowa. Kropka. Modele językowe — zwłaszcza starsze — trzymają równe tempo i podobną długość zdań. Płaski rytm to drugi sygnał ostrzegawczy.
Sęk w tym, że oba wskaźniki mierzą styl, nie pochodzenie. Osoba pisząca prostym, poprawnym, podręcznikowym językiem — na przykład ktoś piszący w obcym dla siebie języku — statystycznie wygląda jak maszyna. Do tego wrócimy, bo to największy grzech detektorów.
Watermarking: SynthID-Text, czyli znak wodny w słowach
Zupełnie inne podejście to znakowanie tekstu u źródła. Google DeepMind opracowało SynthID-Text — technologię opisaną w czasopiśmie „Nature" i udostępnioną jako open source w październiku 2024 r. (przez Hugging Face i Responsible GenAI Toolkit). Podczas generowania model delikatnie przesuwa prawdopodobieństwa wyboru słów według tajnego klucza — czytelnik niczego nie zauważa, ale detektor znający klucz widzi statystyczny „podpis". Według Google watermark nie pogarsza jakości ani szybkości generowania. W 2025 r. DeepMind udostępniło zunifikowany SynthID Detector (tekst, obraz, audio, wideo), a pod koniec 2025 r. weryfikacja trafiła do ekosystemu Gemini.
Watermarking to technicznie najuczciwsze rozwiązanie — ale ma trzy słabości. Po pierwsze: działa tylko na tekstach z modeli, które go stosują (ChatGPT czy Claude nie znakują tekstu SynthID-em). Po drugie: solidna parafraza lub tłumaczenie potrafi zatrzeć sygnał, zwłaszcza w krótkich tekstach. Po trzecie: nie ma wspólnego standardu między firmami — każdy znakuje po swojemu albo wcale.
Ile detektory naprawdę się mylą? Twarde liczby
To najważniejsza część tego tekstu, więc trzymamy się wyłącznie zweryfikowanych danych.
OpenAI skapitulowało jako pierwsze. Własny „AI Text Classifier" firmy rozpoznawał poprawnie tylko 26% tekstów napisanych przez AI, a 9% tekstów ludzkich błędnie oznaczał jako maszynowe. OpenAI wycofało narzędzie po cichu 20 lipca 2023 r. „z powodu niskiej skuteczności" — i do dziś nie wypuściło następcy, deklarując prace nad technikami proweniencji (znakowaniem u źródła) zamiast detekcji post factum.
Stanford: detektory dyskryminują piszących w obcym języku. Badanie zespołu Jamesa Zou (opublikowane w „Patterns", 2023) przetestowało siedem popularnych detektorów na 91 esejach TOEFL pisanych przez osoby, dla których angielski nie jest językiem ojczystym. Wynik: średnio 61,3% fałszywych oskarżeń. Co najmniej jeden detektor oznaczył jako „AI" aż 97,8% tych ludzkich esejów, a 19,8% zostało jednogłośnie uznanych za maszynowe przez wszystkie siedem narzędzi. Te same detektory na esejach amerykańskich ósmoklasistów myliły się rzadko. Powód jest dokładnie tym, o czym pisaliśmy wyżej: prostsze słownictwo i regularniejsza składnia = niska perplexity = „werdykt: maszyna". Autorzy wprost ostrzegli przed używaniem detektorów w edukacji.
Turnitin: marketing kontra niezależne testy. Gigant antyplagiatowy deklaruje mniej niż 1% fałszywych pozytywów na poziomie dokumentu (walidacja na setkach tysięcy prac sprzed ery ChatGPT) i sam przyznaje, że błędy częściej dotyczą pierwszych i ostatnich zdań tekstu oraz wyników poniżej 20% — których z tego powodu w ogóle nie pokazuje. Niezależne testy bywają jednak mniej łaskawe: badania akademickie i dziennikarskie raportowały odsetki fałszywych pozytywów od kilku do kilkunastu procent, szczególnie u osób niepiszących w języku ojczystym. Przy tysiącach prac sprawdzanych w semestrze nawet „1%" oznacza realnych, niesłusznie oskarżonych ludzi — co opisał The Markup na przykładach studentów zagranicznych w USA.
GPTZero i Originality.ai. Oba narzędzia wypadają w porównaniach najlepiej z dostępnych — Originality.ai jest w niezależnych zestawieniach chwalone za wykrywanie parafrazowanych tekstów, GPTZero za relatywnie niski odsetek fałszywych alarmów. Ale „najlepszy z zawodnych" to wciąż zawodny: testy na dużych próbach pokazują, że deklarowane przez producentów ułamki procenta fałszywych pozytywów w warunkach rzeczywistych potrafią urosnąć do kilkunastu procent, a skuteczność na mocno sparafrazowanym tekście AI spada w okolice rzutu monetą.
Humanizery: wyścig zbrojeń, którego nie da się wygrać
Skoro detektory mierzą statystykę stylu, to wystarczy statystykę zaburzyć. Tak działają „humanizery" — narzędzia, które parafrazują tekst AI: podmieniają synonimy, łamią rytm zdań, dodają drobne niezgrabności. Każda nowa generacja detektorów uczy się rozpoznawać ślady popularnych humanizerów, a każda nowa generacja humanizerów uczy się je zacierać. To klasyczny wyścig zbrojeń — z asymetrią na korzyść atakującego, bo humanizerowi wystarczy zejść poniżej progu alarmu, a detektor musi mieć rację zawsze. Konsekwencja praktyczna: negatywny wynik detektora nie dowodzi, że tekst napisał człowiek, a pozytywny nie dowodzi, że maszyna. Detektor mierzy podobieństwo do znanych mu wzorców, nic więcej.
Art. 50 AI Act: od sierpnia 2026 oznaczanie staje się prawem
Do tej pory wykrywanie AI było problemem technicznym. Od 2 sierpnia 2026 r. staje się też prawnym — wtedy zaczynają obowiązywać wymogi przejrzystości z art. 50 rozporządzenia 2024/1689 (AI Act). W skrócie: dostawcy systemów generatywnych muszą znakować treści syntetyczne w sposób możliwy do maszynowego odczytu (i tu właśnie wraca watermarking w stylu SynthID), deepfaki muszą być jawnie oznaczone, a publikowane teksty wygenerowane przez AI, które informują opinię publiczną o sprawach leżących w interesie publicznym, wymagają ujawnienia — chyba że przeszły redakcyjną weryfikację i odpowiedzialność człowieka. Komisja Europejska opublikowała w czerwcu 2026 r. finalny Kodeks postępowania w sprawie oznaczania treści AI (z propozycjami jednolitych ikon), a za niewykonanie obowiązków grożą kary do 15 mln euro lub 3% globalnego rocznego obrotu. Dla polskiego twórcy czy marketera wniosek jest prosty: przejrzystość przestaje być kwestią etyki, a staje się compliance.
Praktyczne wnioski
Jeśli jesteś twórcą lub copywriterem:
- Dokumentuj proces. Pisz w narzędziu z historią wersji (Google Docs, Word z OneDrive, Git). Pełna historia edycji to najmocniejszy dowód autorstwa, jaki istnieje.
- Zachowuj materiały robocze: notatki, konspekty, źródła, wcześniejsze szkice. W razie sporu pokazujesz drogę, nie tylko wynik.
- Nie „pierz" tekstu humanizerami — jeśli klient odkryje, że płacił za zamaskowany output AI, stracisz więcej niż zlecenie.
- Ujawniaj użycie AI z własnej inicjatywy, zwłaszcza w treściach informacyjnych — od sierpnia 2026 i tak będziesz musiał, a uczciwość dziś buduje zaufanie na jutro.
Jeśli jesteś nauczycielem lub pracodawcą:
- Nigdy nie podejmuj decyzji na podstawie pojedynczego wyniku detektora. Liczby ze Stanfordu i przypadek klasyfikatora OpenAI pokazują, że to dowód poszlakowy, nie rozstrzygający.
- Traktuj wynik jako sygnał do rozmowy, nie wyrok: poproś o omówienie tekstu, o szkice, o napisanie fragmentu na miejscu.
- Uważaj na podwójną karę dla osób piszących w obcym języku — w Polsce dotyczy to np. studentów zagranicznych i pracowników piszących po angielsku.
- Zamiast zakazywać — ureguluj. Jasna polityka „AI wolno używać do X, trzeba ujawnić Y" działa lepiej niż polowanie na czarownice z zawodnym narzędziem.
Werdykt
Czy da się wykryć tekst AI? Czasem tak — surowy, niesparafrazowany output najnowszych modeli wciąż łapią najlepsze detektory. Ale „czasem" to za mało, żeby kogokolwiek oskarżać. Przyszłość należy nie do zgadywania po stylu, tylko do proweniencji: znaków wodnych, metadanych i obowiązków przejrzystości, które AI Act zamienia w prawo. Do tego czasu najlepszym detektorem pozostaje człowiek, który zna autora — i historia wersji dokumentu.
Źródła: Stanford HAI — AI-Detectors Biased Against Non-Native English Writers; Liang i in., „GPT detectors are biased against non-native English writers", Patterns (2023); OpenAI — New AI classifier (z notą o wycofaniu, lipiec 2023); Google DeepMind — SynthID; SynthID-Text na GitHubie (open source); Turnitin — Understanding false positives; The Markup — AI Detection Tools Falsely Accuse International Students; Komisja Europejska — Code of Practice on marking and labelling of AI-generated content.
Tekst powstał z pomocą AI i przeszedł weryfikację redakcyjną człowieka. Grafiki: wygenerowane przez AI (Gemini).