Google właśnie pokazało, że nie potrzebuje numerka "4.0", żeby przepisać reguły gry — wystarczyły dwa dni konferencji, kilkanaście produktów i jedna liczba, która robi wrażenie: 2,5 miliarda użytkowników AI Overviews miesięcznie.
Modele: co jest, czego nie ma i dlaczego to ważne
Zacznijmy od tego, co wszyscy chcieli wiedzieć: Gemini 4.0 nie został ogłoszony. Jeśli czytałeś gdzieś inaczej — to była spekulacja. Flagowym modelem produkcyjnym dla subskrybentów Pro pozostaje Gemini 3.1 Pro, natomiast nowością jest Gemini 3.5 Flash — i to właśnie on napędza teraz wyszukiwarkę Google dla wszystkich użytkowników na świecie.
Gemini 3.5 Flash to pierwsza propozycja z nowej rodziny łączącej "frontier intelligence z działaniem" — język marketingowy, ale za nim stoją konkretne liczby. Model jest 4-krotnie szybszy od konkurencyjnych modeli frontier i bije Gemini 3.1 Pro w benchmarkach kodowania, zadań agentycznych i multimodalnych. Dostępny przez Gemini API, AI Studio, Android Studio i platformę Antigravity.
Drugi model to Gemini Omni — nowa seria łącząca wnioskowanie z generowaniem mediów. Przyjmuje na wejściu tekst, obraz, audio i wideo, a na wyjściu generuje wideo zakorzenione w wiedzy o świecie rzeczywistym, z możliwością edycji. To bezpośrednia odpowiedź Google na modele generatywne wideo konkurencji — i pierwsza ich propozycja, która integruje wiedzę bazową modelu z produkcją treści wizualnych. Dostęp dla płatnych subskrybentów.
Wyszukiwarka: 25 lat i nagle wszystko inaczej
Google nazwało to "największą aktualizacją pola wyszukiwania od ponad 25 lat" — i choć takie zdania z reguły brzmią jak PR, tym razem mają pokrycie w danych.
AI Mode — tryb wyszukiwania oparty całkowicie na modelu językowym — osiągnął miliard użytkowników w pierwszym roku i od teraz jest domyślnym trybem globalnie. Napędza go Gemini 3.5 Flash. Nie ma już "klasycznej" wyszukiwarki jako domyślnego doświadczenia.
Do tego dochodzą dwie nowe warstwy:
- Generative UI w Search — wyszukiwarka dynamicznie składa układ strony wyników: tabele, wykresy, symulacje — w czasie rzeczywistym, przez platformę Antigravity. Bez dodatkowych kosztów, globalne wdrożenie latem 2026.
- Search Agents (oficjalnie: "information agents") — agenty działające 24/7 w tle, które monitorują tematy i dostarczają wyniki bez aktywnego zapytania. Latem 2026 dla subskrybentów AI Pro i Ultra.
Żeby poczuć skalę: AI Overviews, czyli bloki z odpowiedziami AI nad wynikami, ma teraz 2,5 miliarda użytkowników miesięcznie. To liczba większa niż całkowita liczba internautów w Europie i Ameryce Północnej razem wzięta.
Project Astra: wreszcie coś konkretnego
Project Astra — wizja Google "uniwersalnego asystenta AI" — przestał być demonstracją laboratoryjną. Został zintegrowany z Gemini Live i działa przez kamerę smartfona w czasie rzeczywistym: przetwarza jednocześnie obraz i dźwięk, rozumie kontekst tego, co widzisz, i odpowiada na bieżąco.
Przykład: wskazujesz kamerą na uszkodzone urządzenie, pytasz co jest nie tak — Astra widzi to samo co ty i odpowiada. Albo skanujesz półkę z produktami i pytasz o skład. Skupienie na 2026: użytkownicy Androida przez Gemini Live i Google Lens.
Android 17 i Android Halo: agenty w pasku statusu
Android 17 trafi stabilnie w czerwcu 2026, dzień pierwszego wydania na urządzenia Pixel 6 przez całą serię Pixel 10. Kluczowe funkcje:
- Rambler — dyktowanie głosowe nowej generacji, które rozumie kontekst i koryguje treść, nie tylko transkrybuje
- AI Widgets — widżety napędzane modelem językowym, dynamicznie dostosowujące treść
- Pause Point — system zapamiętujący stan aplikacji w momencie przerwania i wznawiający dokładnie w tym samym miejscu
- Material 3 Expressive — nowy design system z ulepszoną obsługą składanych ekranów i dużych wyświetlaczy
- Łatwiejsze przenoszenie danych między Androidem a iPhonem oraz szyfrowane RCS między platformami
Osobna nowość to Android Halo — nowa warstwa interfejsu wyświetlająca aktualizacje od agentów AI w pasku statusu, bez przerywania aktualnie używanej aplikacji. Wyobraź to sobie jako ciche powiadomienie "twój agent skończył zadanie" widoczne w rogu ekranu — bez przeskakiwania do innej aplikacji.
Okulary AR: jesień 2026, dwa warianty
Google ogłosiło Android XR Glasses w dwóch wersjach:
- Audio glasses — bez wyświetlacza, Gemini mówi do ciebie przez głośnik przy uchu
- Display glasses — z wyświetlaczem nakładającym informacje na pole widzenia
Launch: jesień 2026. Partnerzy: Samsung, Gentle Monster, Warby Parker. Działają z Androidem i iOS. Aktywacja przez "Hey Google" lub dotknięcie. Funkcje: tłumaczenie mowy i tekstu w czasie rzeczywistym z zachowaniem tonu głosu rozmówcy, nawigacja ze świadomością kierunku, wizualne pytania o otoczenie.
To bezpośredni konkurent dla Meta Ray-Ban — tyle że z Gemini zamiast Llamy i z wariantem wyświetlaczowym, którego Meta jeszcze nie ma w masowej produkcji.
Gemini Spark: agent, który pracuje gdy śpisz
Gemini Spark to nowy osobisty agent AI działający całą dobę w tle — przez Workspace, własne konektory i otwarty web — nawet gdy urządzenie jest wyłączone. Zbudowany na Gemini 3.5 i platformie Antigravity.
Spark proaktywnie wysyła ważne aktualizacje, ale wymaga wyraźnej zgody użytkownika dla działań wysokiego ryzyka — jak wysłanie maila czy dokonanie płatności. Beta trafia najpierw do "zaufanych testerów" w gronie subskrybentów AI Ultra w USA.
Praktycznie: Spark może monitorować temat badawczy, zbierać dane z różnych źródeł, przygotowywać raporty i powiadamiać cię o zmianach — bez jednego ręcznego kliknięcia z twojej strony. To jest rzeczywiście inna liga niż "zapytaj chatbota".
NotebookLM i Workspace: mniej klikania, więcej treści
NotebookLM dostał funkcję Literature Insights: wyszukuje literaturę naukową i strukturyzuje wyniki w tabele z niestandardowymi atrybutami do porównań. Na wyjściu: raporty, slajdy, infografiki, przeglądy audio i wideo. Dla badaczy i content marketerów to zmiana workflow.
W Google Workspace:
- Docs Live — mówisz strumieniem myśli, Gemini drafuje pełny dokument; głosowa edycja w locie. Latem 2026 dla subskrybentów.
- Google Pics — generowanie i edycja obrazów zintegrowane z Drive, Docs i Slides: przesuwanie obiektów, zmiana rozmiaru, modyfikacja i tłumaczenie tekstu w obrazach.
Subskrypcje: nowe ceny, nowy model rozliczeń
Google przeprojektowało całą strukturę płatności. Oto co jest teraz:
| Plan | Cena/mies. | Storage | Limity użycia | Dodatki |
|---|---|---|---|---|
| AI Plus | $7,99 | 200 GB | 2× | — |
| AI Pro | $19,99 | 5 TB | 4× | YouTube Premium Lite, Gemini 3.1 Pro |
| AI Ultra | $99,99 | 20 TB | 20× | YouTube Premium, Gemini Spark beta, Gemini Omni |
Poprzedni najdroższy pakiet kosztował $250 — teraz AI Ultra to $99,99 (wcześniej $200 po jednej obniżce, teraz kolejna). Zmienił się też model rozliczeń: zamiast stałego limitu promptów dziennie, Google przeszło na compute-based limits — proste pytania tekstowe zużywają znacznie mniej limitu niż generowanie wideo czy złożone zadania kodowania.
To mądry ruch: użytkownik pytający o przepis kulinarny nie zajmuje zasobu potrzebnego do wygenerowania 30-sekundowego klipu. Limity stają się bardziej sprawiedliwe dla typowych przypadków użycia.
Dla deweloperów: Antigravity i WebMCP
Platforma Google Antigravity to fundament, na którym stoi większość nowych produktów. Z perspektywy developera: jedno wywołanie API uruchamia zdalny sandbox Linux z dostępem do przeglądarki, wykonywaniem kodu i zarządzaniem plikami — gotowy agent w chmurze bez konfiguracji infrastruktury.
WebMCP to propozycja otwartego standardu webowego umożliwiającego agentom w przeglądarce wywoływanie funkcji JavaScript i formularzy HTML. Jeśli zostanie przyjęty, może stać się dla agentów tym, czym HTTP był dla stron — wspólnym językiem komunikacji między agentem a dowolną stroną.
Gemini for Science łączy się z ponad 30 głównymi bazami danych nauk przyrodniczych przez Antigravity — agentyczny dostęp do literatury naukowej bezpośrednio z modelu.
Content Credentials: znak wodny dla AI
Mniej spektakularny, ale ważny: Google rozszerza weryfikację Content Credentials na Search i Chrome. System oznacza treści etykietą informującą, czy materiał był generowany przez AI, nagrany kamerą, albo edytowany z użyciem generatywnego AI. Dotyczy zarówno obrazów, jak i wideo.
To standardowy mechanizm wywodzący się z inicjatywy C2PA — Google nie wymyśla tu koła, ale daje mu masowy zasięg przez wyszukiwarkę i przeglądarkę.
Podsumowanie praktyczne
Google I/O 2026 nie było konferencją o jednym wielkim modelu. Było konferencją o infrastrukturze agentycznej — o tym, jak AI przestaje być odpowiedzią na pytanie i zaczyna być procesem działającym w tle.
Co z tego wynika konkretnie:
- Jeśli pracujesz z treścią — Docs Live i Google Pics zmienią workflow w Workspace już latem. Warto być na AI Pro ($19,99) choćby dla 5 TB i dostępu do tych funkcji pierwszego dnia.
- Jeśli robisz research — NotebookLM Literature Insights to narzędzie klasy naukowej dostępne za cenę subskrypcji. Połącz z Gemini for Science i masz dostęp do 30+ baz danych z jednego interfejsu.
- Jeśli budujesz produkty AI — Antigravity Managed Agents i WebMCP to tematy, które warto mieć na radarze. Standard WebMCP może zdominować komunikację agentów z webem tak jak REST zdominował API.
- Jeśli jesteś użytkownikiem Androida — Android 17 w czerwcu z Halo i Rambler to realna zmiana ergonomii codziennej pracy, nie tylko nowy design.
- Gemini Spark brzmi jak futurologia, ale trafi do pierwszych użytkowników jeszcze w tym roku. Jeśli masz zadania, które wymagają ciągłego monitorowania (ceny, newsy, dane rynkowe) — warto obserwować, jak szybko beta otworzy się poza USA.
Gemini 4.0 nie przyszedł. Ale to, co przyszło, zmienia nie tyle model językowy, co sposób w jaki AI wchodzi w systemy, z których już korzystasz. I to jest poważniejsza zmiana niż numer wersji.