Kineski tehnološki giganti ByteDance i Kuaishou lansirali su nove modele generativne umjetne inteligencije, Seedance 2.0 i Kling 3.0, koji proizvode videozapise gotovo neprepoznatljive od stvarnosti. Stručnjaci upozoravaju da je time pređena granica iza koje više ne možemo vjerovati nijednom snimku, dok filmska i TV industrija ulaze u eru radikalne transformacije i potpune nesigurnosti

Po prvi put, dvije generativne vještačke inteligencije dostigle su nivo realizma i koherentnosti koji omogućava proizvodnju sintetičkih videa i filmova neprepoznatljivih od velikih holivudskih superprodukcija.

Generativna vještačka inteligencija prešla je kritični prag koji će iz temelja promijeniti industriju televizije, filma i oglašavanja. No, to je tek dio priče. Ono što izaziva ozbiljniju zabrinutost jeste činjenica da je, kako je svojevremeno predviđeno u dokumentarcu „Control Z: Kraj stvarnosti“, umjetna inteligencija praktično dokinula vjerodostojnost svakog audiovizuelnog materijala. Razlika je jedino u vremenu: umjesto 2030, prelomni trenutak stigao je u februaru 2026. godine.

Upravo tog mjeseca kineski tehnološki giganti ByteDance, vlasnik TikToka, i Kuaishou Technology predstavili su nove verzije svojih modela za generiranje videa,  Seedance 2.0 i Kling 3.0. Ovi alati, sposobni da sintetiziraju videozapise s fizičkom koherentnošću, sinhroniziranim zvukom i gotovo fotografskom vjernošću na osnovu multimodalnih uputa, uklonili su tehničke barijere koje su dosad razdvajale sintetički sadržaj od stvarno snimljenog materijala. Reakcija tržišta bila je trenutna: dionice više kompanija iz sektora naglo su porasle, slijedeći uzlet vrijednosti Kuaishoua.

Arhitektura modela Kling 3.0 zasniva se na onome što Kuaishou naziva „Sve u jednom“ produktnim okvirom, koji objedinjuje razumijevanje, generiranje i montažu videa u jedinstven radni tok. Sistem omogućava kreiranje isječaka do 15 sekundi, uključujući kompleksne sekvence i duge kadrove, čime prevazilazi ograničenja vremenske koherentnosti koja su opterećivala ranije generacije modela.

S druge strane, Seedance 2.0 impresionira sposobnošću generiranja hiperrealističnih likova i preciznom kontrolom montaže, omogućavajući korisnicima da mijenjaju pojedine dijelove sadržaja bez narušavanja ostatka scene. Rivalstvo ova dva tehnološka diva fokusirano je upravo na narativnu kontrolu.

Kling 3.0 uvodi funkcije poput inteligentnog višekadrovskog pripovijedanja, koje dinamički prilagođava uglove kamere kako bi realiziralo složene filmske tehnike poput kadra–kontrakadra ili paralelne montaže. Dodatno, funkcija Omni omogućava kreatorima da učitaju referentne videozapise, nakon čega umjetna inteligencija precizno preuzima i replicira vizuelne karakteristike i glas određenog lika u novim scenama, osiguravajući kontinuitet „sintetičkog glumca“.

Kvalitativni skok primjetan je i u segmentu zvuka. Kling 3.0 generira izvorni, sinhronizirani audio na više jezika, uključujući engleski, kineski, japanski, korejski i španski te omogućava kreiranje složenih dijaloških scena u kojima svaki lik može govoriti drugim jezikom, uz pravilnu intonaciju i redoslijed. Time se eliminira potreba za vanjskim alatima za postsinhronizaciju ili zvučnu obradu.

Seedance 2.0 nudi potpunu multimodalnu ulaznu podršku, omogućavajući kombinovanje teksta, slika i postojećeg zvuka kao smjernica za generiranje videa. Analitičari iz Kaiyuan Securities predviđaju da će ova fleksibilnost prvo biti masovno prihvaćena u segmentima mange i kratkih AI drama.

Snaga i dostupnost ovih alata, praktično bilo kome, bilo gdje u svijetu, prijete da radikalno smanje troškove produkcije televizijskog i filmskog sadržaja. Kuaishou tvrdi da lansiranje Klinga 3.0 označava temeljnu promjenu u ulozi umjetne inteligencije: od pukog generativnog alata do „inteligentnog kreativnog partnera“. Sa više od 60 miliona kreatora i 600 miliona proizvedenih videa od prvog lansiranja u junu 2024. godine, razmjeri usvajanja ove tehnologije već su masovni.

Prema ocjenama stručnjaka, tehnologija je dostigla tačku u kojoj može destabilizirati tradicionalnu industriju, istovremeno otvarajući prostor svakome ko ima ideju i talent da stvara bez ograničenja produkcijskih budžeta.

No, ova disrupcija ima visoku cijenu. Ne samo tehničku, generiranje videa zahtijeva ogromnu procesorsku snagu i značajnu potrošnju energije, već i epistemološku, jer pogađa samu strukturu percepcije stvarnosti.

Apsolutni realizam otvorit će vrata širenju lažnih videozapisa koji su na ranijim platformama poput Sore ili Vea još uvijek bili relativno lako prepoznatljivi. Sposobnost Klinga 3.0 da precizno očuva tekst unutar slike dodatno olakšava falsificiranje dokumenata i manipulativnih videosadržaja u svrhu dezinformiranja javnosti. Granica između realnog i sintetičkog praktično je izbrisana: korisnici već dijele filmske isječke u kojima su originalni glumci zamijenjeni drugima, uz zapanjujuću vjerodostojnost.

To u praksi znači kraj provjerljive stvarnosti u videoformatu. Ako Kling 3.0 može simulirati višejezične dijaloge s glumcima koji ne postoje, a Seedance 2.0 omogućava „hiruršku“ preciznost u uređivanju stvarnosti, povjerenje u audiovizuelne materijale trajno je narušeno.

Ovi modeli ne oponašaju stvarnost, oni je apsorbiraju, preoblikuju i reproduciraju s tehničkom savršenošću koja onemogućava razlikovanje istine od algoritamske fikcije. Ulazimo u novu eru postistine, sada u visokoj rezoluciji, i bez jasnih mehanizama odbrane.

Generativna vještačka inteligencija prešla je kritični prag koji će transformirati televiziju, film i oglašavanje. No, to je tek površina promjene. Suštinsko pitanje glasi: šta ostaje od stvarnosti kada joj više ne možemo vjerovati?

IZVOR: El Confidencial