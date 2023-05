Nowy model sztucznej inteligencji do zadań specjalnych

Gdy został wypuszczony ChatGPT, pojawiły się pojedyncze głosy, że sposób odpowiadania przez generatywną sztuczną inteligencje jest zbyt miły. Korea Południowa uznała, że przyda się nowy model językowy, wyszkolony w najgorszej części internetu, czyli Dark Webie i nazwali ją DarkBERT.

Modele językowe sztucznej inteligencji, wyszkolone na „zwykłej” części internetu, tej, którą wszyscy znamy, może nie być w stanie zrozumieć obyczajów i przyzwyczajeń językowych użytkowników Dark Webu. Wyszkolenie jej w rozumieniu specyficznego żargonu pozwoliłoby to na skuteczniejsze przeszukiwanie treści tam zawartych badaczom oraz organom ścigania walczącym z cyberprzestępczością.

Czym jest Dark Web?

Wokół pojęcia Dark Web krąży wiele opowieści, które w większości wydają się przesadzone. Jest to część internetu, którą większość przeglądarek po prostu ignoruje ze względów bezpieczeństwa użytkowników. Dostać się tam można za pomocą specjalistycznego oprogramowania.

Miejskie legendy mówią o okropnościach, które się tam na co dzień odbywają, od sal tortur, przez płatnych zabójców do wszelkiego rodzaju przerażających przestępstw najgorszych zwyrodnialców. Jednak, jak to się zwykle okazuje, prawda nie jest aż taka „interesująca”. W większości przypadków oszustwa w Dark Webie dotyczą kradzieży danych i drobnych przestępstw na użytkownikach sieci.

DarkBERT będzie walczył z cyberprzestępczością

Tym, co najbardziej interesuje organy ścigania, jest to, że Dark Web jest wykorzystywany do prowadzenia ukrytych rozmów między członkami zorganizowanych sieci przestępczych. W związku z czym, potrzebne jest narzędzie, które pomoże przeszukiwać określone obszary internetu i skutecznie wychwytywać wszelkie podejrzane działania czy rozmowy.

Zespół z Korei Południowej zaprogramował model sztucznej inteligencji w taki sposób, aby przeszukiwała Dark Web i wracała z surowymi danymi. Model DarkBERT porównany został z wcześniejszymi wersjami, w tym z RoBERTAa i BERT. Okazało się, że najnowszy model wyprzedza resztę we wszystkich zestawach danych, wyróżniając się na tle starszych wersji. Wykazała się znacznie większą wydajnością niż RoBERTa z 2019 roku, mimo że opiera się na takiej samej strukturze.

DarkBERT wykorzystany ma zostać przede wszystkim do walki z przestępczością w Dark Webie. Stanowi potężne narzędzie do skanowania ogromnych ilości danych w poszukiwaniu cyberzagrożeń. Ma również śledzić wszelkiego rodzaju fora, których użytkownicy podejrzani są o nielegalne praktyki. Możemy mieć tylko nadzieję, że nie znajdzie tam żadnych kodów do odpalania rakiet.