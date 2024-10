Nie jest to jednak jedyny wybryk Claude’a z tamtej prezentacji. W innym przypadku zatrzymał on nagrywanie ekranu, co poskutkowało utratą całego nagrania. Prawdopodobnie niedługo, gdy nowy model będzie testowany przez większą liczbę użytkowników, będziemy mogli zaobserwować więcej nietypowych sytuacji z udziałem Claude’a. Pytanie jednak, czy zabawne zdarzenia to jedyne co może być wynikiem problemów z tego rodzaju agentami AI?

Czy agenci AI mogą być niebezpieczni?

Chociaż opisywane przez Anthropic błędy wydają się nieszkodliwe, na myśl nasuwa się pytanie, czy AI o takim stopniu autonomii może być bezpieczna. Co by się stało, gdyby Claude, zamiast przeglądać zdjęcia Yellowstone, postanowił dostać się na nasze media społecznościowe lub jakimś cudem uzyskał dostęp do konta bankowego?

Istnieje także ryzyko, że ludzie mogliby wykorzystać AI w nieodpowiedni sposób - na przykład do rozsyłania spamu, dezinformacji czy oszustw, a przejęcie kontroli nad agentem przez cyberprzestępców mogłoby doprowadzić do katastrofalnych skutków.

Firma Anthropic zdaje sobie sprawę z tych zagrożeń i podejmuje działania mające na celu zapewnienie bezpiecznego używania modelu. Wprowadzono m.in. mechanizmy, które mają na celu rozpoznawanie i zapobieganie działaniom, które uznano za niebezpieczne. Na ten moment wiadomo, że należą do nich: publikowanie treści w mediach społecznościowych oraz uzyskiwanie dostępu do stron rządowych.