Najnowsze AI od NVIDII zmienia bazgroły w fotorealistyczną grafikę

Koniec czasów rozbrajających poradników w stylu, jak narysować sowę - narysuj dwa kółka, a potem… resztę sowy. Teraz wystarczy nagryzmolić coś na wyświetlaczu, a oprogramowanie w mgnieniu oka całą resztę zrobi za nas.

Najnowsze AI od NVIDII zmienia bazgroły w fotorealistyczną grafikęGeekweek - import

Czyżbyśmy w końcu dożyli czasów, kiedy każdy z nas może zostać grafikiem komputerowym? Na to wygląda, oczywiście pod warunkiem, że mamy pod ręką potrzebne narzędzia, jak najnowsze oprogramowanie Nvidii. To nosi nazwę GauGAN, co ma był ukłonem w stronę francuskiego post-impresjonisty Paula Gauguina oraz GAN, czyli przetwarzania Generative Adversarial Network wykorzystywanego do generowania scen.

Ich choć całość brzmi na bardzo zaawansowaną technologię, którą oczywiście jest, to w praktyce dla użytkownika sprowadza się do narysowania prostego kształtu i wybrania jednej z wielu dostępnych kategorii - algorytmy zrobią resztę, bazując na milionach wcześniej przeanalizowanych zdjęć (wszystko dobrze widać na filmie poniżej). Jak twierdzi założyciel Nvidii i jej CEO, Jensen Huang, to ogromny krok w zakresie trenowania sztucznej inteligencji, bo w końcu udało się wyeliminować jej wąskie gardło, czyli… udział człowieka.

Do tej pory wyglądało to tak, że jeśli chcieliśmy, by AI nauczyło się rozpoznawać wspomnianą już sowę, to trzeba było udostępnić mu wiele zdjęć tego ptaka i dosłownie wskazać na niego palcem, co zajmowało mnóstwo czasu. I tu do akcji wkroczył GAN, który działa na zasadzie rywalizacji między dwoma sieciami neuronowymi trenowanymi i nagradzanymi w różny sposób - jedna ma za zadanie generować fałszywe obrazy sów, a druga nauczyć się je odróżniać od prawdziwych. Pierwszą nagradza się za stworzenie fałszywki, której druga nie rozpozna i tak… miliony razy.

Jak to się przekłada na GauGAN? Kiedy narysujemy kształt, algorytm porówna go z wszystkimi wcześniej widzianymi, a następnie wypełni wedle naszych życzeń, jako choćby góry, lasy, jezioro, drogę, niebo i tym podobne. Rezultaty są zaskakujące, choć czujne ludzkie oko jest w stanie wyłapać różnicę między taką grafiką i zdjęciami, ale to przecież nic złego. Po pierwsze narzędzie ciągle jest rozwijane, a po drugie pozwala na szybkie tworzenie potrzebnych grafik, co wykorzystać można choćby do tworzenia gier wideo - a biorąc pod uwagę miejsce NVIDII w tym segmencie, z pewnością było to jednym z głównych założeń.

Źródło: GeekWeek.pl/newatlas/Fot. NVIDIA