Nowa wersja ChatGPT. Myśli i działa za użytkownika

Generatywna sztuczna inteligencja wielu czołowych producentów ewoluuje ze zwykłych czatbotów do roli osobistych asystentów lub agentów AI. Oznacza to, że zakres jej możliwości wykracza poza odpowiadania na pytania w okienku czatu. OpenAI zaprezentowało agenta ChatGPT. Ta nowa funkcja potrafi wykonywać zadania w imieniu użytkownika, wyręczając go w szeregu obowiązków. Sprawdź, w czym może pomóc tobie, jak możesz go kontrolować oraz czy to w ogóle bezpieczne.

Agent ChatGPT wykona za ciebie szereg czynności w przeglądarce. Ty tylko zlecasz, kontrolujesz i zatwierdzasz albo odrzucaszOpenAImateriały prasowe

Spis treści:

Mniej gadania, więcej działania. Co zrobi za ciebie ChatGPT?

Agenci AI to specjalne aplikacje oparte na sztucznej inteligencji, które mogą uzyskiwać kontrolowany i nadzorowany przez użytkownika dostęp do innych aplikacji, jak np. przeglądarka internetowa, aby wykonywać w nich różne działania niczym osobisty asystent. Teraz taką funkcjonalność otrzymał słynny ChatGPT. To już nie tylko bot konwersacyjny. Otrzymał on sprawczość i może wykonywać szereg zadań. Co może dla ciebie zrobić?

Możesz teraz poprosić ChatGPT, aby obsłużył polecenia takie jak "popatrz na mój kalendarz i wprowadź mnie w nadchodzące spotkanie z klientem, bazując na ostatnich aktualnościach", "zaplanuj i kup składniki na japońskie śniadanie dla czworga" albo "przeanalizuj trzech rywali i utwórz prezentację". ChatGPT inteligentnie nawiguje po stronach internetowych, przefiltruje wyniki, w razie potrzeby poprosi cię o bezpieczne logowanie, uruchomi kod, przeprowadzi analizy, a nawet dostarczy edytowalne pokazy slajdów i arkusze kalkulacyjne, które podsumowują jego wyniki - wyjaśnia OpenAI.

Agent ChatGPT opiera się na rozwijanej od dłuższego czasu przez OpenAI infrastrukturze agentów, czyli programów wykonujących zadania wykraczające poza konwersację. Wykorzystuje do tego zdolności agenta Operator, który potrafi nawigować i podejmować działania na stronach internetowych w swojej własnej przeglądarce, a także na silniku rozumowania i syntezowania informacji Deep Research oraz na zdolnościach dużych modeli językowych (LLMs) leżących u podstaw ChatuGPT.

Czy agent ChatGPT jest bezpieczny? To użytkownik ma kontrolę

W jaki sposób ChatGPT obsługuje te wszystkie zadania? Gdzie to się właściwie odbywa? "ChatGPT wykonuje te wszystkie zadania, korzystając z własnego wirtualnego komputera, płynnie przechodząc między rozumowaniem a działaniem, aby obsługiwać złożone przepływy pracy od początku do końca - wszystko w oparciu o twoje instrukcje" - wyjaśnia producent. Agent ChatGPT nie jest sztuczną inteligencją działającą na twoim urządzeniu. Z uwagi na duże zapotrzebowanie na moc obliczeniową jego rozumowanie odbywa się fizycznie w chmurze, czyli na serwerach OpenAI. Są to zbyt duże modele, by mogły uruchomić się lokalnie na twoim komputerze albo telefonie bez połączenia z internetem. Nie mają one też bezpośredniego dostępu do twojego systemu operacyjnego ani lokalnego systemu plików.

To oprogramowanie o pewnym stopniu autonomii. Jak dużym? To zależy od użytkownika. Producent przekonuje, że to użytkownik ma zawsze kontrolę nad tym, co robi ChatGPT. Przed wykonaniem akcji, która może mieć jakieś konsekwencje, agent prosi użytkownika o zgodę. My zaś możemy przerwać jego działanie w dowolnym momencie, przejąć kontrolę nad przeglądarką albo całkiem go zatrzymać.

Nie jest więc tak, że ChatGPT samodzielnie zaszaleje z zakupami albo zarezerwuje nam bilety na samolot, a nam przyjdzie niespodziewany rachunek. Autonomia tego agenta (i podobnych mu rozwiązań) polega na pewnej samodzielności w wykonywaniu zadań, ale tylko w sferze przygotowania "wersji roboczej". To człowiek zatwierdza lub odrzuca kluczowe decyzje. Może też dokonywać modyfikacji i przejmować kontrolę. Jego autoryzacja jest także potrzebna, gdy trzeba się gdzieś zalogować.

Przypomina to trochę hierarchię w firmach, gdzie pracownicy mogą wykazać się inwencją, wykonując polecenia przełożonych, ale kluczowe działania muszą przejść przez odpowiednią kontrolę, np. dział finansów, menadżerów wyższego szczebla albo nawet dyrektora. Nie bez powodu rozwiązania typu agent AI porównywane są do pracowników - juniorów.

Dla kogo jest dostępny agent ChatGPT i kto jeszcze oferuje takie funkcje?

Kto może z tego wszystkiego skorzystać? Na dzień dzisiejszy ChatGPT agent jest dostępny dla płatnych subskrybentów ChatGPT Pro, Plus i Team. Mogą oni wybrać "tryb agenta" podczas zwykłej konwersacji na czacie. Nie podano jeszcze, kiedy ta funkcjonalność trafi do użytkowników darmowej wersji. OpenAI przekonuje tymczasem, że to dopiero początek, a "agentowe" funkcje ChatGPT będą dalej rozwijane.

OpenAI nie jest jedynym twórcą sztucznej inteligencji, który swoje boty konwersacyjne wyposażył w możliwość realnego działania. Są także alternatywy dla ChatGPT. Znamy już choćby takie usługi jak Microsoft 365 Copilot, któremu w aplikacjach Office możemy zlecić np. wykonanie prezentacji PowerPoint na podstawie dokumentu Worda czy PDF albo napisanie e-maila. Możliwości asystenta/agenta zyskuje także Microsoft Copilot w Windows (jako spadkobierca Cortany) i Gemini w wyszukiwarce Google.

Z kolei nad połączeniem AI nowej generacji z funkcjami asystentki w pocie czoła pracuje Apple. Siri stanie się dużo mądrzejsza, ale prawdopodobnie dopiero w przyszłym roku. Osiągnięcia na tym polu ma również Amazon, którego asystentka Alexa została zaktualizowana do wersji Alexa+, wzbogaconej o nowoczesne funkcje GenAI.

Zobacz również:

Agenci AI już działają. Tak zmienią twoją pracę (i nie tylko)

Sztuczna inteligencja

Zrobią wszystko za ciebie? Nowa AI uczy się, planuje i działa samodzielnie

Karol Kubak

"Wydarzenia": Sławosz już na Ziemi. Polski astronauta opuścił kapsułę DragonPolsat NewsPolsat News

Spis treści:

Mniej gadania, więcej działania. Co zrobi za ciebie ChatGPT?

Czy agent ChatGPT jest bezpieczny? To użytkownik ma kontrolę

Dla kogo jest dostępny agent ChatGPT i kto jeszcze oferuje takie funkcje?

Zobacz również:

Najnowsze