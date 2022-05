Tak zwane generatory słowo-na-obraz (text to speech) to algorytmy sztucznej inteligencji, które rysują to, co wymyśli człowiek. W kwietniu swój algorytm DALL-E 2 pokazała firma OpenAI, kilka dni temu swój - o nazwie Imagen - pokazało Google.

Oba algorytmy wytrenowano na przykładach obrazów i ich opisów. Gdy poda im się nowy opis obrazka, szybko generują coś, co wiernie przypomina ilustracje, na których się uczyły. “Pies w basenie"? Proszę bardzo, realistyczna grafika psiaka w czepku gotowa. “Kot w domu z piernika"? Żaden problem.

Chcemy coś bardziej wyszukanego? Algorytm Google'a da radę nawet stworzyć "zalane wnętrze muzeum sztuki z obrazami Moneta, w której roboty pływają na tratwach z wiosłami".

Zdjęcie Sztuczna inteligencja potrafi tworzyć bardzo realistyczne obrazy na podstawie złożonych opisów / Imagen/Google / materiały prasowe

Sceptycy wskazują, że firmy nie pokazały algorytmów w działaniu, a jedynie wygenerowane przez nie obrazki. Stąd podejrzenie, że pokazano najlepsze dzieła sztucznej inteligencji, inne mogą być znacznie gorszej jakości.

Wstydliwy problem sztucznej inteligencji

Zarówno Google jak i OpenAI twierdzą, że nie mogą upublicznić nawet demonstracyjnych wersji algorytmów-rysowników. Obawiają się bardzo realistycznych deep-fake’ów.

Sęk w tym, że obawiają się raczej czegoś innego. Oba algorytmy uczenia maszynowego firmy trenowały na zbiorze zwanym LAION-400M. To miliony darmowych zdjęć i ilustracji z opisami zebranych z internetu. Część z nich zawiera treści rasistowskie, część stereotypy, a część zwykłą pornografię.

Tego oczywiście nie pokazano, ale oba algorytmy mogą więc mieć niezbyt przyjemne skrzywienie. Ich efekty pracy niekoniecznie nadawać się do ilustracji książeczek dla dzieci. Obie firmy chcą poprawić algorytmy, by takie treści (rasistowskie, szkalujące i pronografię) filtrowały.

To zapewne potrwa, więc do tego czasu rysownicy i graficy komputerowi mogą spać spokojnie. Jest jeszcze jeden powód, dla którego nie warto porzucać pracy grafika-ilustratora.

Trenowanie algorytmów na setkach milionach przykładów wymaga superkomputerów i jest piekielnie drogie. Oba algorytmy kosztowały firmy dziesiątki milionów dolarów. Nawet jeśli ocenzurowane wersje Imagen i DALL-E 2 zostaną udostępnione, na ich wykorzystywanie zapewne stać będzie tylko największe firmy.