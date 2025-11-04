Spis treści: Will Smith je spaghetti, czyli niezwykły realizm generatorów filmów AI Filmy z Veo 3 lub Sora 2. Po czym je poznać? Szczegóły techniczne. Zwróć uwagę na TikToku i Instagramie Analizatory AI mogą się mylić. Prawda miesza się z fikcją

Will Smith je spaghetti, czyli niezwykły realizm generatorów filmów AI

Generator filmów AI to oprogramowanie oparte na modelu sztucznej inteligencji działające zwykle na zasadzie text-to-video, czyli tworzenia filmu, od niedawna również z dźwiękiem, na podstawie opisu tekstowego przesłanego przez użytkownika. Narzędzia te pozwalają też przesłać zdjęcie lub film, by na ich podstawie wygenerować kontynuację. Obecnie prym wiodą dwa takie generatory: Veo 3 od Google i Sora 2 od OpenAI.

Powszechny dostęp do tych narzędzi i względnie niski koszt ich używania (w niektórych przypadkach jest to wręcz darmowe) sprawiają, że ludzie masowo po nie sięgają, a następnie udostępniają wideo wygenerowane przez AI na Instagramie, Facebooku czy TikToku. Nie zawsze fakt korzystania z narzędzi AI jest wyraźnie zaznaczony, mimo że platformy mogą tego wymagać. Potencjalnie może to wprowadzać widzów w błąd. O ile bowiem nie mamy do czynienia z ewidentną rozrywką czy abstrakcją, możemy paść ofiarą dezinformacji, kiedy deepfake przedstawia coś istotnego, np. zagrożenie katastrofą, wypowiedź polityka lub nawet wizerunek bliskiej nam osoby.

Wideo z generatora AI staje się coraz bardziej realistyczne. Choć jest to trochę żartem, to do oceny tego realizmu używa się wideo z Willem Smithem jedzącym spaghetti. Jeszcze w 2023 roku generatory tworzyły ten obraz, przypominający halucynacje lub sen. Teraz jest on już bardzo realistyczny, ale nadal do odróżnienia od prawdziwych nagrań z użyciem kamery i żywych ludzi. Po czym właściwie można poznać, że film został stworzony przez AI?

Filmy z Veo 3 lub Sora 2. Po czym je poznać?

Wideo wygenerowane przy pomocy Veo 3 lub Sora 2 bywa tak realistyczne, że można dać się nabrać. A wyobraźmy sobie, co będzie za kilka lat... Póki co możemy skupić się na pewnych sygnałach ostrzegawczych, które mogą świadczyć, że klip jest dziełem sztucznej inteligencji. Jednym z nich jest niska jakość obrazu, na którym widać rozmazania, ziarnistość czy rozpikselowanie. Nie stanowi to 100% dowodu na działanie AI, lecz jedynie znaczącą przesłankę. Generatory wciąż nie są idealne i popełniają błędy - film nie zawsze renderuje się płynnie i występują tzw. artefakty - jak przy złej kompresji obrazu. Przynajmniej na razie może to wskazywać na oszustwo. Już za parę lat narzędzia mogą zostać praktycznie pozbawione tych niedociągnięć.

Może także dochodzić do celowego pogarszania jakości, by ukryć artefakty. Sztucznej inteligencji można wydać polecenie, aby wyrenderował film wyglądający na kręcony telefonem komórkowym z lat dwutysięcznych albo starą kamerą analogową. Takie postarzające filtry mogą maskować niedociągnięcia i wzmacniać wiarygodność.

Kolejną wskazówką stanowią znikające lub dziwnie przekształcające się elementy. Zachowania obiektów i postaci na ekranie nieraz wydają się przeczyć prawom fizyki, jak gdyby zachodziła iluzja. Piłka, która spuszczona z wysokości odbija się znacznie wyżej, osoba skacząca do basenu wywołująca tsunami czy postać wyłaniająca się ze skrótu perspektywicznego swojej sylwetki w nienaturalny sposób to niektóre przykłady.

Warto też przyglądać się detalom. Przykłady? Dwa przypięte mikrofony krawatowe zamiast jednego, dziwne napisy w tle, znikające i pojawiające się znikąd przedmioty, sześć palców u rąk lub zmiany w scenografii, gdy wirtualna kamera powraca po czasie do danej sceny.

Szczegóły techniczne. Zwróć uwagę na TikToku i Instagramie

Jak twierdzą eksperci, ważne kryteria stanowią również szczegóły techniczne. Dzisiejsze generatory mają swoje ograniczenia co do długości, rozdzielczości i proporcji obrazu filmu. Veo 3 i Sora 2 pozwalają renderować pojedyncze klipy o długości maksymalnie 8 sekund, rozdzielczości 720p lub 1080p oraz proporcji obrazu 16:9 lub 9:16. Istnieją sposoby na wydłużenie nagrań, sztucznego zwiększenia rozdzielczości przy użyciu AI (tzw. upscalingu, np. do 4K) czy kadrowania innego niż panoramiczne, jednak wiele klipów z generatora ląduje w social mediach w formie surowej. Wynika to choćby z lenistwa, braku czasu lub nieumiejętności posługiwania się edytorami wideo przez użytkowników tych narzędzi.

Po czym poznać film AI na TikToku, Facebooku czy Instagramie? Według ekspertów "normalne" rolki mają często około 30-60 sekund, podczas gdy filmy z generatora są krótsze - to zaledwie 6- albo 8-sekundowe klipy. W przypadku tych dłuższych, ale również wygenerowanych, możemy dostrzec cięcia co 6 lub 8 sekund. Rzadko zdarza się, by obraz był połączony na tyle "bezszwowo", by tych łączeń nie można było dostrzec. Najczęściej nie ma też między tymi poszczególnymi klipami ciągłości fabularnej.

Veo 3 i Sora 2 nakładają ponadto na wideo znak wodny. To standardowa praktyka. Jeden z nich jest widoczny i zawiera nazwę narzędzia, podczas gdy drugi jest niewidoczny i dodawany do filmu w formie metadanych pliku. Oba można w łatwy sposób usunąć przy użyciu innych narzędzi. W przypadku tego widocznego znaku można go zastąpić generatywnie z uwzględnieniem otaczającej zawartości. Metadane, które mogą być zaciągane przez social media do weryfikowania i informowania o pochodzeniu klipu, można z pliku usunąć ręcznie lub wykonać nagranie nagrania, aby przepadły.

Analizatory AI mogą się mylić. Prawda miesza się z fikcją

Równolegle z samymi narzędziami opracowywane są także sposoby na automatyczną identyfikację ich dzieł. Analizatory AI do pewnego stopnia są w stanie wykrywać filmy, obrazy i teksty wygenerowane przez AI, ale podobnie jak ludzie często daje się oszukać. Nie możemy już dłużej wierzyć własnym oczom. Problem z tym mają nawet sami twórcy tych narzędzi, tacy jak OpenAI i Google, a także wydawcy social mediów.

Trzeba też pamiętać, że generatory AI tworzone są przez wiele innych podmiotów, które niekoniecznie przestrzegają zasad etycznych ani standardów. Filmy wykonane z ich pomocą mogą mieć inną długość, rozdzielczość i jakość, a także mogą przedstawiać sytuacje i postaci niedozwolone przez zasady użytkowania Google czy OpenAI.

Wiele wskazuje na to, że generatory wideo AI będą coraz lepsze, a ich efekty - coraz bardziej realistyczne. Dzisiejsze wyznaczniki mogą się zdezaktualizować w ciągu paru miesięcy. Niewykluczone, że do wykrycia fejka potrzeba będzie narzędzi i ekspertów na poziomie co najmniej kryminalistyki. Chyba że twórcy sztucznej inteligencji równie gorliwie, co swoje modele generatywne, rozwijać będą również ich analizatory. W przeciwnym razie czeka nas jeszcze większy zalew fałszywych treści i zupełne pomieszanie prawdy z fikcją.

Grobowiec Amenhotepa III w Dolinie Królów otwarty dla zwiedzających po 226 latach od odkrycia © 2025 Associated Press