Narzędzie przyszłości czy zagrożenie? Rewolucja technologii obrazów AI

Generatory obrazów AI szturmem wzięły 2022 rok, stając się jedną z najgłośniejszych technologii zeszłego roku. Nagle okazało się, że sztuczna inteligencja jest w stanie wygenerować obraz, na podstawie jakiejkolwiek kombinacji słów, jaka przyjdzie nam do głowy. Stanęliśmy przed obliczem prawdziwej rewolucji, która przyniosła także realny strach o przyszłość humanizmu.

AI w 2022 roku pokazało nam, że może tworzyć rzeczy jakich sobie nigdy nie wyobrażaliśmy
AI w 2022 roku pokazało nam, że może tworzyć rzeczy jakich sobie nigdy nie wyobrażaliśmy 123RF/PICSEL
AI w 2022 roku pokazało nam, że może tworzyć rzeczy jakich sobie nigdy nie wyobrażaliśmy
AI w 2022 roku pokazało nam, że może tworzyć rzeczy jakich sobie nigdy nie wyobrażaliśmy 123RF/PICSEL

2022 rokiem obrazów generowanych przez AI

Rewolucja z ostatniego roku dotycząca generatorów obrazów polegała na tym, że po raz pierwszy pozwoliły na stworzenie praktycznie każdego obrazu, jaki sobie wyobraziliśmy. Nie serwują przy tym już kiedyś powstałych rzeczy, a wymyślają nowe i oryginalne twory. Wykorzystują przy tym inżynierię podpowiedzi, polegającą na wpisywaniu tekstu do stworzenia obrazu. To dosłownie odwrócenie modelu gdzie AI dokonuje opisu obrazu, na podstawie analizy jego elementów. Tu analizowane są słowa, tworząc obraz.

Jak to wygląda na dużą skalę, po raz pierwszy pokazała firma Open AI, swoim programem Dall-E, który zapowiedziała w 2021. Przecieki wskazywały na prawdziwą rewolucję wykorzystania AI, która miała swoje ograniczenia. Na bazie ulepszeń w kwietniu 2022 roku zaprezentowano Dall-E 2, które ukształtowało postrzeganie nowych generatorów obrazów AI. Ludzie oszaleli na jego punkcie, szczególnie po udostępnieniu do masowego użytku we wrześniu.

Pojawiły się nowe i darmowe generatory, które pozwoliły na uwolnienie naszej wyobraźni, pokazując potęgę AI. Obok Dall-E 2 udostępnione zostały takie generatory jak Stable Diffusion i Midjournay, które zadziwiały świat. Jak jednak to robiły?

Jak działa prawdziwa magia obrazów AI?

AI generujące obrazy to nie jest całkowicie nowa technologia. Wykorzystywano ją m.in. do tworzenia twarzy nieistniejących ludzi, którzy kiedyś zalewali Facebooka. To, czemu wykorzystanie tej technologii w 2022 można nazwać rewolucyjnym, wynika ze skali jej wiedzy oraz możliwości jej wykorzystania. Nowe generatory obrazów AI korzystają z nielimitowanych baz danych prawie wszystkich zdjęć w historii. Dzięki temu trenują swoją wiedzę nt. elementów obrazu. Pozwalają tym na stworzenie dosłownie wszystkiego.

Oto jedno z wyobrażeń AI programu Dall-E tego jak wygląda "Polska"
Oto jedno z wyobrażeń AI programu Dall-E tego jak wygląda "Polska"Dall-E/Marcin Jabłońskimateriał zewnętrzny

Generatory obrazów AI nie kopiują bezpośrednio informacji z już istniejących obrazów. Zamiast tego wykorzystują metryki różnych parametrów. Dzięki nim poznają rozróżnienie kształtu, koloru, jasności i wielu innych rzeczy przedstawianych na obrazach. Liczba analizowanych parametrów jest ogromna w takich generatorach, często biorąc pod uwagę rzeczy, które ludzki umysł nawet by nie wyłapał. Ich suma tworzy matematyczną "przestrzeń utajoną", w której operują programy, wyciągając z niej tworzone obrazy.

Ta "przestrzeń" do dziś w większości pozostaje tajemnicą, z tego względu, że nie jesteśmy w stanie przetworzyć zawartej w niej ilości danych. Ich skalę można przedstawić w ten sposób: jeżeli dane wykorzystywane do wspomnianych wcześniej sztucznych twarzy z Facebooka można byłoby zamknąć w pudełku zapałek, tak te w najnowszych generatorach obrazów potrzebowałyby przestrzeni rozległej jak masa kosmiczna z Ziemi do centrum galaktyki Andromedy.

Ostatnią rzeczą, dzięki której programy jak Dalle-E tworzą obrazy, jest proces nazywany dyfuzją, czyli niejako połączenia podpowiedzi. To ona pozwala stworzyć obraz np. sławetnego różowego słonia, tworząc koncepcję połączenia słowa "różowy" i "słoń". Przy tym za każdym razem pozwala na wygenerowanie nowego obrazka do tych samych słów. Cały proces generowania obrazów przez najnowsze AI, który zobaczyliśmy w 2022 roku, był wręcz magicznym widowiskiem.

Dosłownie tworzenie tego, co nie istnieje

Generatory obrazów AI sprawiły, że w 2022 roku internet zalały obrazy, o których wcześniej nie śniliśmy. Wykorzystujące popularne motywy, stworzyły nowe trendy.

Dzięki generatorom AI możemy zobaczyć np. jak wyglądałyby różne dzieła popkultury, utrzymane w konwencji filmów dark fantasy z lat 80. W ten sposób ludzie stworzyli... popularne memy w estetyce wyjętej rodem z filmu Conan Barbarzyńca.

Technologia pozwoliła także na tworzenie własnych "teledysków", gdzie na bazie tekstu piosenek AI tworzyło serie obrazów.

Zasadniczo ludzie bardzo szybko załapali, że jedynym ograniczeniem w wykorzystaniu generatorów obrazów AI jest tylko i wyłącznie nasza wyobraźnia i chęci. Można tworzyć rzeczy piękne, śmieszne, dziwne czy straszne.

Dzięki generatorom obrazów AI możemy zobaczyć dosłownie wszystko jak np. bezzępnego tyranozaura jeżdżącego na rowerze na planie Parku Jurajskiego
Dzięki generatorom obrazów AI możemy zobaczyć dosłownie wszystko jak np. bezzępnego tyranozaura jeżdżącego na rowerze na planie Parku JurajskiegoDall-E/Marcin Jabłońskimateriał zewnętrzny

Rewolucja generatorów obrazów AI pozwoliły dosłownie stworzyć coś z niczego, wykorzystując ludzką wyobraźnię. Ta koncepcja przypominała czyste science-fiction. Dla wielu zaczęła stanowić podstawę, do próby jej wykorzystania w innych dziedzinach. Bo jeśli z niczego sztuczna inteligencja jest już w stanie tworzyć artystyczne obrazy, to co stoi na przeszkodzie, aby tworzyła np. wynalazki? I tak samo, jak szybko mechanizm tworzenia czegoś z niczego rozszerzał się w generatorach obrazów, tak zaczął on pojawiać się w innych dziedzinach.

Technologia mogąca tworzyć leki na nieuleczalne choroby

Przede wszystkim rozwój technologii pojawił się m.in. w medycynie. Wykorzystanie koncepcji matematycznej "przestrzeni utajonej" może przynieść odkrycia biologiczne, które stworzą nowe leki. Niektóre firmy już próbują to robić.

W grudniu 2022 startup z Bostonu Generate Biomedicines ujawnił swój program o nazwie Chroma, który ochrzcił mianem "Dall-E biologii". Jego model AI ma bowiem wykorzystywać ten sam mechanizm co program do generowania zdjęć. Niemniej, zamiast obrazów ma tworzyć projekty nowych białek. Według założeń Chroma będzie miała swoje parametry białek, mogąc tworzyć ich różne rodzaje, spełniające konkretne cele. W ten sposób mogłyby powstawać nowe leki na niewyleczalne choroby.

Możemy w ciągu kilku minut odkryć to, co zajęło ewolucji miliony lat
Gevorg Grigoryan, kierownik ds. technologii firmy Generate Biomedicines w wypowiedzi dla MIT Technology Review

W tym samym czasie podobny model nazwany RoseTTAFold Diffusion tworzy Uniwersytet Waszyngtoński. To rozwinięcie wykorzystania AI, które zapoczątkowały zwykłe generatory obrazów, mogą przyczynić się do poprawy jakości życia.

Niemniej rozwój tej technologii przyniósł ze sobą także wiele obaw. Generatory obrazów AI, jak i ich technologia używana w innych dziedzinach pokazała bowiem, jak bardzo rozwinięta już jest sztuczna inteligencja. I jak łatwo może zastąpić człowieka nawet w tych czynnościach, które wcześniej uważano za bezpieczne od możliwej robotyzacji.

Śmierć artysty

Oczywiście technologia generowania obrazów AI ma ciągle duże wady i nie zawsze jest dokładna. Jej efekty jednak są na tyle dobre, że przykuła uwagę artystów, którzy zauważają szkodliwość technologii.

Podstawą są tu kwestie praw autorskich. Generatory obrazów AI mogą stworzyć sztukę wyglądającą jak żywcem wyjętą z dzieł konkretnego artysty. Możemy sobie tworzyć obrazy w stylu Picassa, Van Gogha czy Banksy’ego. To jednak rodzi pytanie, czy etyczne jest tworzenie sztuki konkretnych artystów, w ogóle pomijając ich proces twórczy. Często bowiem AI generując obraz na wzór stylu i motywów jakiegoś autora, może pominąć informacje o nim.

AI może nam pokazać, jak wyglądałaby Warszawa na obrazach Vincenta Van Gogha, bez jakiegokolwiek udziału artysty w "swojej" pracy
AI może nam pokazać, jak wyglądałaby Warszawa na obrazach Vincenta Van Gogha, bez jakiegokolwiek udziału artysty w "swojej" pracyDall-E/Marcin Jabłońskimateriał zewnętrzny

Wielu bije na alarm, że w ten sposób generatory obrazów AI pozbawiają ich możliwości zarobku. Bo skoro pierwszy lepszy program może tworzyć sztukę, to po co zwracać się samych artystów? Tu pojawia się kwestia rywalizacji, gdzie artyści czują się zagrożeni, że sami staną się zawodem wymierającym. W 2022 pojawiły się historie, że obrazy wygenerowane przez AI wygrywały konkursy artystyczne, a wielu miłośników sztuki porzucały oferty twórców, na rzecz subskrypcji udostępniających szerszą ofertę generatorów obrazów.

Technologia AI tworząca obrazy, pokazała jak łatwo można zastąpić człowieka, w prawie każdej czynności. I jak istnieje wiele głosów, że artyści nie wymrą, bo AI bazuje na ich pracach, tak wielu nie uśmiecha się zdegradowanie do roli bycia dostarczycielem zasobów dla sztucznej inteligencji.

Nowy świat fake'ów i szkodliwych stereotypów?

Nie mówiąc także, że obrazy generowane przez AI mogą stać się podstawą masy fake newsów, przedstawiając wydarzenia, które nigdy nie miały miejsca. Zauważa się, że coraz bardziej realistyczne obrazy AI mogą przyczynić się do kompletnego zatarcia linii między prawdą a fikcją w internecie. Tworzenie obrazów wykracza już poza zwykłą dezinformację, dając możliwość tworzenia zupełnie nowych rzeczywistości.

Technologia AI wykracza poza manipulację istniejącymi mediami, przechodząc do produkcji w pełni syntetycznych treści... ostatecznie umożliwiając szybkie i łatwe generowanie fałszywych dowodów wizualnych jako bezpośredniego uzupełnienia fałszywych narracji (newsowych)
treść raportu zatytułowanego What a Pixel can tell: Text-to-Image Generation and its Disinformation Potential autorstwa Democracy Reporting International

Wydarzenia ostatnich lat pokazały, jak potężną bronią potrafi być zwykła dezinformacja, na podstawie tekstu, czy przekłamanego obrazka. Możliwość tworzenia obrazów, wyglądających jak wyjęte z prawdziwego świata tworzą zupełnie nowe zagrożenie.

Ponadto eksperci zauważyli, że przynajmniej na razie generatory obrazów pomijają masę treści, chociażby domyślnie skupiając swoją sztukę na wyobrażeniach Zachodu. W ten sposób obrazy pomijają m.in. kulturę afrykańską. Przy tym zauważono mocne wykorzystywanie często krzywdzących stereotypów przez AI np. łączenie takich słów jak "dyrektor" czy "CEO" tylko z mężczyznami.

Nie oznacza to jednak, że wybuch popularności generatorów obrazów AI jest czymś, czego trzeba się bać. To niejako wynik rozwoju sztucznej inteligencji. Odpowiednie jej ujarzmienie może przyczynić się do ogromnego rozwoju ludzkości. A te ujarzmienie zacząć trzeba właśnie od odpowiedniego rozwoju sztuki generatorów obrazów.

Biblioteka niezłomna. Ukraińcy mają miejsce, w którym czuć normalnośćAFP
INTERIA.PL
Masz sugestie, uwagi albo widzisz błąd?
Dołącz do nas