Hakerzy przejęli najgroźniejszy model AI na świecie. Wykradli go korporacjom
Najniebezpieczniejszy model sztucznej inteligencji znalazł się w niepowołanych rękach. Anthropic potwierdził we wtorek (21 kwietnia), że prowadzi dochodzenie w sprawie raportów o nieuprawnionym dostępie do Claude Mythos - modelu, który według samej korporacji jest zbyt groźny, by udostępnić go szerokiej publiczności. Wyciek miał nastąpić poprzez środowisko jednego z zewnętrznych dostawców, co stawia pod znakiem zapytania procedury bezpieczeństwa firmy współpracującej z czołówką gigantów technologicznych przy testowaniu zabezpieczeń oprogramowania używanego przez miliardy ludzi.

W skrócie
- Anthropic prowadzi dochodzenie w sprawie nieuprawnionego dostępu do wyjątkowo groźnego i potężnego modelu Claude Mythos, dostępnego oficjalnie tylko dla wybranych partnerów.
- Do naruszenia doszło poprzez wyciek danych oraz dzięki współpracy osoby z legalnym dostępem jako pracownika zewnętrznego kontrahenta.
- Anonimowa grupa hakerów deklaruje, że nie ma złośliwych zamiarów, lecz sytuacja ta budzi obawy co do skuteczności zabezpieczeń oraz wpływu na systemy technologiczne korzystające z modeli Anthropic.
- Więcej podobnych informacji znajdziesz na stronie głównej serwisu
Najgroźniejszy model AI trafił w niepowołane ręce
Claude Mythos to model sztucznej inteligencji o szczególnych zdolnościach, z niezwykłą sprawnością identyfikujący i wykorzystujący luki w zabezpieczeniach niemal każdego systemu operacyjnego oraz przeglądarki internetowej. Lepiej niż jakiekolwiek inne zautomatyzowane narzędzie, a prawdopodobnie nawet i człowiek, wykrywa on podatności - także w oprogramowaniu, które według powszechnych mitów uchodzi za nienaruszalne. Mythos odkrył m.in. niewykryty przez 27 lat błąd w OpenBSD oraz łańcuch podatności w Linuksie, umożliwiający całkowite przejęcie kontroli nad maszyną.
Wykazuje on też niepokojące zdolności spod szyldu autonomicznej, agentowej sztucznej inteligencji. Mythos zademonstrował umiejętności samodzielnego łamania zabezpieczeń, uzyskiwania nieautoryzowanego dostępu do sieci oraz zacierania śladów swojej aktywności. Potrafi też celowo zaniżać swoją precyzję, by uniknąć podejrzeń, czy publikować poufne dane w publicznych repozytoriach. Stojące za nim algorytmy są tak skomplikowane, że eksperci nie do końca wiedzą, dlaczego to robi. Szczegółowo o wyczynach Claude Mythos pisaliśmy w GeekWeeku w pierwszej połowie kwietnia.
Z powodu tego potencjału ofensywnego i nieprzewidywalności Anthropic utworzył program o naziwe Project Glasswing. W jego ramach dostęp do najniebezpieczniejszego modelu AI na świecie otrzymała jedynie wyselekcjonowana grupa partnerów, w tym Apple, Amazon, Microsoft czy Cisco, a także wybrane instytucje finansowe i agencje rządowe. Celem tego ograniczenia miało być wzmocnienie produktów gigantów technologicznych przed przyszłymi atakami. Doszło jednak do incydentu z nieautoryzowanym dostępem. Pokazuje to, jak trudne jest utrzymanie tak potężnego narzędzia w pełnej izolacji.
Claude Mythos w rękach hakerów. Przełamali zabezpieczenia Anthropic
Najpotężniejsza i najgroźniejsza sztuczna inteligencja, jaką do tej pory stworzono, miała nigdy nie trafić do szerszego grona użytkowników. Anthropic udostępnił ją tylko wybranym partnerom, obawiając się, by nie wpadła w niepowołane ręce. Ten czarny scenariusz właśnie się sprawdził. We wtorek (21 kwietnia) firma potwierdziła, że prowadzi dochodzenie w sprawie raportów o nieuprawnionym dostępie do Claude Mythos. Co dokładnie się wydarzyło?
Kulisy przejęcia dostępu przez anonimową grupę hakerów przypominają scenariusz cyber thrillera. Do naruszenia doszło już 7 kwietnia, czyli dokładnie w dniu ogłoszenia startu projektu Glasswing. Kolektyw, działający na prywatnym kanale w serwisie Discord, wykorzystał kombinację kilku czynników. Przede wszystkim pomógł mu wyciek danych ze startupu Mercor, zajmującego się trenowaniem AI, co dostarczyło informacji o formacie adresów sieciowych stosowanych przez Anthropic. Wykorzystując te dane oraz boty przeczesujące platformę GitHub w poszukiwaniu śladów nieopublikowanych modeli, hakerzy zdołali odgadnąć lokalizację Mythosa.
Operacja nie byłaby jednak możliwa bez "kreta" czy też "insidera". Jeden z członków grupy posiadał legalne uprawnienia do pracy z modelami Anthropic jako pracownik zewnętrznego kontrahenta zajmującego się ewaluacją technologii. Wykorzystując swoje stanowisko oraz narzędzia typowe dla badaczy cyberbezpieczeństwa, umożliwił on grupie swobodne korzystanie z modelu.
Demokratyzacja AI. Potężna technologia nie tylko dla wielkich korporacji
Mimo że Claude Mythos posiada zdolności do przeprowadzania niszczycielskich cyberataków, sprawcy twierdzą, że ich motywacje są czysto poznawcze. Twierdzą oni, że skupiają się na testowaniu możliwości modelu w prostych zadaniach, takich jak tworzenie stron internetowych, celowo unikając zapytań związanych z hakowaniem, by nie wzbudzić podejrzeń systemów monitorujących Anthropic.
Jeśli istotnie ich motywacją jest haktywizm i tzw. white-hat hacking, ich inicjatywa może stanowić próbę wymuszonej demokratyzacji AI, czyli przekazania ("kolektywizacji") potężnych narzędzi, by służyły zwykłym ludziom, a nie tylko największym korporacjom z sektora big tech czy rządom państw. Z drugiej strony, jeśli tej "etycznym hakerom" udało się przełamać zabezpieczenia Anthropic, może to zachęcić także grupy o niecnych zamiarach.
Co na to Anthropic? Twórcy kontrowersyjnego modelu przekonują, że obecnie nie ma dowodów na to, by nieautoryzowany dostęp wykroczył poza środowisko zewnętrznego dostawcy lub wpłynął na wewnętrzne systemy firmy. Sytuacja ta stawia jednak pod znakiem zapytania skuteczność ochrony technologii, którą sam producent określa mianem najbardziej przerażającego modelu AI na świecie.
Tajemnicza grupa anonimowych hakerów deklaruje brak złośliwych zamiarów, ale już sam fakt, że osoby postronne mogą regularnie korzystać z narzędzia zdolnego do łamania zabezpieczeń w oprogramowaniu używanym przez miliardy ludzi, budzi poważny niepokój wśród ekspertów i instytucji polegających na technologii Anthropic. Dotyczy to nie tylko jego własnych aplikacji, ale również m.in. Copilota w Microsoft 365, który obok GPT od OpenAI daje użytkownikom do wyboru właśnie modele z serii Claude.









