Sztuczna inteligencja w przeglądarce. Kto pierwszy to zrobił?

Sztuczna inteligencja jest sama w sobie pojęciem szerokim. Najczęściej mówimy o modelach AI, zwłaszcza o dużych modelach językowych (LLMs), takich jak GPT, Grok czy Gemini. Ale również one potrzebują punktu końcowego, interfejsu, w którym mogą działać. Konwersacyjna sztuczna inteligencja zwykle jest dla nas dostępna poprzez interfejs czatu, np. apki Copilot, ChatGPT albo Gemini.

Modele AI zasilają też aplikacje do tworzenia obrazów i filmów, wyszukiwarki internetowe czy właściwie dowolne inne aplikacje. Do nich należą też przeglądarki, jednak w ich przypadku ten trend przebiega dość wolno w porównaniu z innymi rodzajami oprogramowania. A to nieco dziwne, bo przecież to właśnie one są dla wielu osób głównym oknem na świat.

Pierwsza przeglądarka internetowa z wbudowaną sztuczną inteligencją to Microsoft Edge. W 2023 roku zintegrowano z nią Bing Chat (Czat Bing, przemianowany później na Microsoft Copilot). Czatbot opiera się na tych samych modelach OpenAI GPT i o-series, co ChatGPT. AI jest dostępna w Edge na pasku bocznym, a także posiada własną ikonę w prawym górnym rogu, co pozwala otwierać czat Copilota równolegle obok stron internetowych. Drugą taką implementację ogłosiła Opera. Jej przeglądarka Opera One również w 2023 roku została wyposażona w sztuczną inteligencję o nazwie Aria.

Google, mimo że jest wydawcą najczęściej używanej przeglądarki na świecie, w tym wyścigu AI wystartował z opóźnieniem. Jego ostatnie osiągnięcia zaprezentowane na Google I/O 2025 pokazują jednak, że firma nadrobiła zaległości. Jej usługi nie tylko dorównują już powstałym wcześniej odpowiednikom OpenAI, ale wychodzą nawet z zupełnie nowymi funkcjami.

Przypomina to technologiczny wyścig zbrojeń. Gdy któryś z twórców AI wypuści coś nowego, pozostali starają się zrobić coś jeszcze lepszego w ciągu najbliższych tygodni lub miesięcy. Z przeglądarkami trwa to jednak o wiele dłużej, a pozostali wydawcy, tacy jak choćby Mozilla, nawet nie startują w tym wyścigu.

Gemini w Chrome rozumie, co się dzieje w otwartych kartach przeglądarki

Google, inspirowany bez wątpienia poczynaniami Microsoftu i Opery, ogłosił dostępność Gemini w Chrome. Jego model sztucznej inteligencji zaczyna być integrowany z przeglądarką - początkowo tylko u subskrybentów nowych planów Google AI Pro ($19,99/miesiąc) i Google AI Ultra ($249,99/miesiąc) w Stanach Zjednoczonych z włączonym językiem angielskim w Chrome na systemach Windows i macOS.

"Ta pierwsza wersja pozwala ci łatwo poprosić Gemini, aby wyjaśnił skomplikowane informacje na dowolnej stronie internetowej, którą czytasz, albo o podsumowanie informacji. W przyszłości Gemini będzie mógł pracować na wielu kartach i nawigować na stronach internetowych w twoim imieniu" - wyjaśnia Google. Przedstawia on Gemini w Chrome jako "twojego asystenta przeglądania AI, który pomoże ci wykonać zadania".

Integracja sztucznej inteligencji z przeglądarką znaczy o wiele więcej niż umieszczenie jej czatbota w bocznym panelu czy rozwijanym menu. Chodzi o dostęp do tego, co znajduje się na otwartych stronach czy w dokumentach. Gemini "widzi" zawartość kart i można zadawać mu pytania na jej temat. W przyszłości będzie on także pełnił funkcję agenta AI w przeglądarce - podobnie jak obecnie OpenAI Operator (działający we własnej przeglądarce), Browser Operator w Operze czy agenty AI tworzone w Copilot Studio, które rozumieją graficzne interfejsy aplikacji i mogą w nich wykonywać zadania na polecenie użytkownika.

Podobnie jak Copilota w Edge, tak również asystenta Gemini w Chrome uruchomimy, klikając jego logo w prawym górnym rogu okna przeglądarki. Otwiera się on w swoim własnym panelu, co pozwala kontynuować pracę w kartach przeglądarki bez potrzeby ciągłego przełączania się na inne karty albo otwierania innych okien. Funkcja dopiero zaczęła być testowana w USA i zapewne niezbyt prędko trafi do Polski. Co jeszcze potrafi Gemini? Dowiedz się tego z naszych ostatnich artykułów.

