Treści generowane przez AI to przyszłość czy zagrożenie? Ekspert odpowiada
Treści automatycznie generowane przez sztuczną inteligencję cieszą się zwykle dość negatywną opinią, jednak czy rzeczywiście powinniśmy w ten sposób do nich podchodzić? W jakich dziedzinach już od dawna z powodzeniem korzystamy z takich treści i jak rozpoznać tekst stworzony przez AI? Na te i inne pytania odpowiedział w rozmowie z Geekweekiem Krzysztof Kamzol - Specjalista ds. SEO i automatyzacji procesów w Traffic Peaks.
Filip Koziarek, Interia Geekweek: Zacznijmy od ogólnego wyjaśnienia - jak realnie działają narzędzia automatycznie tworzące treści?
Krzysztof Kamzol, Traffic Peaks: Może wydawać się to dziwne, ale nawet sami inżynierowie tych rozwiązań nie są w 100 proc. pewni, jakie procesy zachodzą w ich wnętrzu. Na pewno działanie modeli językowych oparte jest o system wektoryzacji danych tzw. embedingi i skomplikowany system sieci neuronowej. O tym, jak przebiega proces transformacji treści dostarczanej przez użytkownika przez model językowy i generowanie odpowiedzi można napisać obszerną książkę. Niemniej zachęcam do skorzystania z ogólnodostępnych zasobów w internecie, które w prosty sposób przedstawiają schemat działania LLM-ów (large language model z ang. duży model językowy przyp. red.).
To o czym warto wspomnieć to zasobożerność takich narzędzi i koszty ich utrzymania. Nawet proste zapytanie wysłane do modelu językowego może wymagać zaangażowania kilkunastu GB pamięci tymczasowej, nie mówiąc o potrzebnej mocy obliczeniowej. I tutaj nie powinno być zaskoczenia, że gigantem przodującym w rozwiązaniach AI jest Nvidia - producent kart graficznych.
Z uwagi na konieczność wielowątkowego przetwarzania danych w modelu językowym, najlepiej w tym względzie sprawdzają się wysokowydajne karty graficzne, a to ile kosztują takie “cacka" doskonale wiedzą gracze komputerowi. Pojedyncza karta graficzna wysokiej klasy to koszt grubo ponad 10 tys. zł. Nvidia wykorzystuje setki tysięcy takich urządzeń do napędzania swoich rozwiązań więc nietrudno wyobrazić sobie wartość całego rynku AI.
Po tym objaśnieniu przejdźmy więc do jednego ze sporych współczesnych problemów. Czy da się w jakiś sposób rozpoznać czy dana treść została stworzona przez AI?
Na początku trzeba mieć świadomość tego, jak działają modele językowe. Mianowicie to, jak bardzo jakościowe dane otrzymamy, zależy od tego, jak wiele szczegółowych instrukcji i danych im dostarczymy. Odpowiednio wytrenowany model językowy jest w stanie wygenerować treść dokładnie w takiej formie, stylistyce i tonie, aby spełnić wszystkie oczekiwania użytkowników i w praktyce takie treści nie wyróżniają się niczym szczególnym tzn. trudno odróżnić je od treści typowo redakcyjnych.
Sytuacja wygląda zgoła inaczej, gdy zostawiamy wolną wolę modelowi językowemu, który wygeneruje treść według własnego "widzimisię". Wtedy, o ile pojedynczy tekst czy artykuł może wydawać się całkiem przystępny, tak przypatrując się wielu takim iteracjom - czyli wielu wynikom generowanym w ten sam sposób - dochodzimy do wniosku, że często powtarza się konkretny wzorzec i tok myślenia sztucznej inteligencji.
Jakie więc są charakterystyczne sygnały wskazujące na to, że treść mogła być wygenerowana automatycznie?
Przykładów tego wzorca jest całkiem sporo. Chociażby początek artykułu rozpoczynający się od słów: “w dzisiejszych czasach", źle zapożyczone zwroty anglojęzyczne typu: "zagłębimy się w technologiczną podróż", nadużywane słowa: "kluczowe/-y/-a", "zrozumienie" lub ich zlepki, np. "kluczowe jest zrozumienie", zbyt natarczywe wypunktowania czy częste tworzenie podsumowań w jakiejkolwiek formie.
Wszystkie te czynniki sprawiają, że w ten sposób szybko i niechlujnie wygenerowane treści po prostu są złe w odbiorze. A zatem w środowisku SEO panuje przekonanie i silny nacisk na to, że każda treść wygenerowana przez modele językowe powinna być weryfikowana i moderowana.
Czy w związku z tym obawy o utratę miejsc pracy w związku z automatycznym generowaniem treści są uzasadnione?
Sztuczna inteligencja powinna służyć pomocą i usprawniać pracę w każdej dziedzinie. W temacie treści generowanych z pomocą AI doskonale sprawdza się korelacja pomiędzy podażą a popytem. Użytkownicy internetu w zdecydowanej większości wolą czytać treści napisane przez ludzi, niż przez oprogramowanie.
Jeżeli utrata pracy,w tym przypadku redaktora, copywritera, wiąże się wyłącznie z wdrożeniem nowych technologii AI, to nie uznawałbym tego za dobrą zmianę. Najnowsze modele językowe są w stanie w ogromnym stopniu wspomóc pracę redaktorów zarówno pod kątem jakościowym, jak i ilościowym. A zatem warunkiem “sprzedania" swoich umiejętności pracodawcy powinna być m.in. chęć wdrażania i korzystania z rozwoju technologii, która de facto ma zwiększyć, a nie zmniejszyć dochody z biznesu.
Sporo wspomina się o zagrożeniach wynikających z treści generowanych przez AI. Czy są to realne problemy?
Na grupach marketingowych, branżowych SEO i podobnych często można przeczytać, że hurtowe generowanie treści z pomocą AI to nic innego jak zaśmiecanie, już i tak bardzo zaśmieconego, internetu. W wielu przypadkach niestety właśnie tak to wygląda.
Inną kwestią jest rzetelność informacji. Jeżeli model językowy nie otrzyma od nas lub nie dysponuje konkretną wiedzą na żądany temat, wtedy zaczynają się jego halucynacje. Tego nie lubią ani użytkownicy, ani wyszukiwarki internetowe, które swoją drogą szybko ucinają zasięgi takich witryn.
Ciekawym zjawiskiem, o którym nie mówi się często jest również efekt “pętli". Modele językowe czerpią wiedzę z ogólnodostępnych zasobów w internecie - w tym de facto treści wygenerowanych przez AI. To oznacza, że sztuczna inteligencja w pewnym stopniu karmi się swoimi produktami i wymysłami, a to w dłuższej perspektywie może przełożyć się na jakość i wiarygodność tworzonych treści.
Można zautomatyzować tworzenie każdego rodzaju treści czy są dziedziny, gdzie ludzka praca jest wciąż niezastąpiona?
Praktycznie każdą treść można wygenerować i będzie ona wysokiej jakości, ale pod warunkiem, że odpowiednio się do tego przygotujemy. Treści wygenerowane przez AI obecne są nie tylko na blogach, ale także w sklepach internetowych w opisach produktów, opisach kategorii sprzedażowych czy opiniach klientów.
Obszary, w których sztuczna inteligencja nadal kuleje to przede wszystkim bardzo precyzyjna i najświeższa wiedza, która spotykana jest chociażby w serwisach newsowych. Ponadto w social media bardzo często słyszymy o aferach związanych z żenująco słabą obsługą klienta, spowodowaną nadużywaniem rozwiązań AI w różnych formach m.in. czatu czy interakcji z klientami.
Dla przykładu "konsultant" pod postem na Facebooku w jednym komentarzu odpowiada dosyć naturalnie na zadane pytanie, ale w drugim po zastosowaniu sfabrykowanego zapytania generuje chociażby fragment kodu w wybranym języku programowania, co jest jasnym dowodem na to, że na odpowiedzi klientów odpowiada model językowy, a nie prawdziwy doradca. Takie wpadki zdarzały się nawet największym gigantom biznesowym na polskim rynku.
Gdzie obecnie automatyczne generowanie treści jest stosowane regularnie i dobrze się przyjęło wśród odbiorców?
Tak jak wspominałem wcześniej, generowanie z pomocą AI to schemat praktykowany w wielu obszarach wiedzy i marketingu. Najprostszym przykładem gdzie treści generowane przez AI cieszą się przeważnie aprobatą użytkowników, są chociażby automatycznie generowane napisy do filmów - funkcja dostępna na YouTube.
Nowością jest również wyszukiwarka ChatGPT od OpenAI, która pojawiła się na rynku względnie niedawno i która ma ogromne szanse skrócić monopol na tym rynku, trzymany przez Google. Opinie wielu użytkowników na temat funkcjonowania tej wyszukiwarki są często bardzo przychylne, więc to wielki krok ku pewnej asymilacji odbiorców z modelami językowymi, które jak widać, rozwijają się w niespotykanym dotąd tempie.
Czy osoby bez szczególnej wiedzy mogą skutecznie korzystać z narzędzi do automatycznego generowania treści?
Na rynku znajdziemy mnóstwo różnych modeli językowych, które przeważnie pozwalają na korzystanie z nich bez opłat, choć często w nieco ograniczonym zakresie. To sprawia, że są chętnie wykorzystywane nawet przez laików w tej dziedzinie. Bez większych problemów każdy może poprosić model językowy o napisanie rozprawki, przepisu kulinarnego, obszernego artykułu blogowego, skrócenia czy rozwinięcia tekstu.
Rozmowa z modelem językowym przypomina rozmowę z drugą osobą i dlatego korzystanie z tych rozwiązań zyskało na popularności już od momentu uruchomienia pierwszych takich narzędzi na rynku.
W takim razie na zakończenie - czy żeby osiągnąć zadowalające wyniki przy automatycznym generowaniu treści ważne jest lepsze zrozumienie jakichś aspektów?
A wracając do drugiej części pytania. Im lepsze jakościowo i ilościowo treści chcemy uzyskać, tym bardziej musimy zagłębić się w specyfikę działania modeli językowych. Nie powinniśmy polegać bezgranicznie na ich wiedzy, a dostarczać im konkretne źródła informacji (np. dokumenty, wycinki tekstu ze stron www), na podstawie których będą w stanie wygenerować autentyczną i przyjazną dla użytkownika treść.
I już na zakończenie, mając na uwadze fakt, że koszty wdrażania i utrzymania rozwiązań AI idą w miliardy dolarów, podsumuję wszystko jednym i trafnym stwierdzeniem: “jest popyt, to jest i podaż".