19.5.2024 | Svátek má Ivo


INTERNET: Vítejte ve zfalšované realitě

24.4.2024

Video na internetu nemusí vždy zobrazovat realitu. Zrovna tak každá písnička, kterou uslyšíte, nemusí pocházet od některého skladatele. A dokonce ji ani nemusí interpretovat skutečná zpěvačka či nějaký zpěvák.

Na to všechno si stačí jen pohrát s umělou inteligencí (AI). Stejně jako u všech výkonných technologií, které se mohou z dobrého sluhy změnit ve špatného pána, je však i s umělou inteligencí třeba zacházet s velkou odpovědností, aby bylo možné řídit rizika a využít její potenciál. Zrychlující se tempo vývoje AI (Artificial intelligence) dokonce naznačuje, že se ocitáme na pokraji dosažení úrovně Artificial general intelligence (AGI), tedy umělé inteligence všeobecné, která překoná lidské kognitivní schopnosti, nebo jim alespoň bude rovna. V souvislosti s dosavadními poznatky se zde ukazuje potřeba kritického zhodnocení naší připravenosti na takovouto transformační technologii a jejích možných dopadů na každý aspekt lidského života, jak po tom volá [1] řada odborníků, podtrhujících naléhavost diskusí o společenských, etických a technologických důsledcích AGI.

I když se nám z laického pohledu zdá být dosažení AGI ještě daleko, neznamená to, že v případě umělé inteligence nezačínáme mít těžkou hlavu z některých jejích nástrojů. Jako třeba z CGI (Computer Generated Imagery), tedy počítačem generované grafiky a efektů ve filmech, televizních programech a jiných médiích. S rozšířením výpočetní techniky a rozvojem mobilních komunikačních technologií se totiž s CGI, ve smyslu počítačem generovaných obrazů, setkáváme prakticky každodenně a na každém kroku.

Generativní modely, postavené na technologii zvané hluboké učení, využívají velké množství dat k trénování systému umělé inteligence při vytváření originálního obsahu videa, tedy digitálních filmů. S nejnovějšími verzemi CGI pracuje již mnoho nezávislých umělců, ale i filmoví nadšenci z řad amatérů. Neuronovou síť, která vytváří hudbu v různých žánrech a uměleckých stylech, pak využívají ke generování kvalitních filmových soundtracků. Nemusí tak financovat nahrávky velkých symfonických orchestrů, ani platit renomované skladatele, ale můžou si vygenerovat původní zvukovou stopu. Nejen pro případ filmové melodie, ale i zvukových efektů, potřebných do jejich filmu. O takovýchto nástrojích umělé inteligence na stránkách Neviditelného psa nedávno psal [2] Marian Kechlibar.

K zadání vstupních příkazů pro provedení úkolů je využíván jejich popis v chatbotu (počítačový program, který simuluje lidskou konverzaci s koncovým uživatelem). Vstupem pro samotné generování videa už ale nemusí být jenom text. CGI dnes dokáže rozpohybovat statický obrázek, zvládne spojit scény ze dvou vstupních videí do jednoho, přičemž také umí zdrojové video prodloužit, ať už pokračováním, nebo vygenerováním úvodních sekvencí. Na požádání vytvoří plynulou smyčku, ale dokáže také scénu z vloženého videa upravit, čehož lze využít třeba k omlazování herců. Například u posledního dílu ságy Indiana Jones producenti nebyli spokojeni s věkem Harrisona Forda a nechali tak umělou inteligenci podle nashromážděných záběrů herce z archivů společnosti Lucasfilm do úvodu nového filmu Indiana Jones a nástroj osudu vizuálně [3] 79letého Forda omladit. Kdy ve výsledku vypadá jako v době, kdy mu bylo 37 let.

A všechny tyto principy a postupy se s učením umělé inteligence neustále zdokonalují. Vývojáři tak hovoří o tom, že každý nadšenec s uměleckým viděním v blízké době vloží několik zásadních nápadů do počítače a pouhým stisknutím tlačítka vytvoří svůj vlastní film, připravený ke streamování a sdílení. Přičemž téměř dokonalý robotický překlad již mnohdy nabízí autentičtější zážitek než dabing. Film tak bude možné bez problémů sledovat prakticky v každém jazyce a umělou inteligencí generované či upravené filmy by se pak mohly prostřednictvím internetové sítě nabízet publiku po celém světě. Je pravda, že nejrůznější na internetu dnes prezentované filmy nadšenců, komplet vytvořené umělou inteligencí, by do kin ještě žádné diváky nepřitáhly. To ale není jejich účel, ve skutečnosti vznikají především proto, aby nabízely pohled na inovativní možnosti dokonalejších nástrojů strojového učení. Zde jedna ukázka určená milovníkům sci-fi, kdy každý prvek tohoto krátkého filmu, od psaní scénáře po vizuální stránku, byl vytvořen umělou inteligencí:

Naši filmaři v tuto chvíli ještě tak daleko nejsou a nějaký čas nebudou, ale třeba animovaný a potažmo loutkový film můžou umělé inteligenci již svěřit. Přičemž i scénář [4] třeba takových u nás oblíbených večerníčků, nebo i hraného seriálu, kvůli čemuž nedávno stávkovali scénáristé v Hollywoodu, dokáže umělá inteligence vygenerovat. Dokáže napsat scénář filmu dle jeho zadání, rovněž původní scénář vylepšit, nebo rozšířit, zakomponovat do něj nové prvky či epizody. Pokud jde pak o samotné postavičky z kreslených filmů, i ty může umělá inteligence animátorům navrhnout a všechny jim nakreslit. Přičemž nejrůznější společnosti přináší neustále další, nové funkce pro animace [5] v reálném čase.

Ovšem umělá inteligence pomocí hlubokého strojového učení dokáže napodobit i modely lidského chování. Čelíme tak úplně novému fenoménu, zahrnovanému pod deepfakes. Tímto termínem se označují digitálně zmanipulované fotografie, videa a zvuky, které se tváří jako opravdové. Na videu lze už nahradit konkrétního člověka někým úplně jiným, případně změnit jeho vzhled a mluvu. Tedy díky nasbíraným záznamům se umělá inteligence naučí jak se ta která konkrétní osoba chová, jak na veřejnosti vystupuje, jak mluví a jak se při tom tváří. To všechno pak aplikuje do vznikajícího hyperrealistického deepfake videa. Uprostřed rozmachu umělé inteligence se tak deepfakes stávají realističtější a jejich odhalení je náročné i pro kybernetického profesionála:

Taková úroveň vývoje bývá označována za Deepfake Singularity, tedy za hluboce falešnou singularitu, přičemž pod singularitou se tu rozumí hypotetický bod zlomu, v němž probíhá nekontrolovatelný a nevratný technologický růst. Pak ovšem divák, který se při sledování videa na internetu spolehne výhradně na to, co zde vidí a slyší, prakticky nemá šanci deepfakes, vygenerované umělou inteligencí, odhalit. Přitom se nepoužívají jen k internetovým vtípkům a do reklam, ale i ke všelijakým podvodům. A třeba v CBC (Canadian Broadcasting Corporation) již zcela vážně diskutují [6] o tom, co se může stát, když budou deepfake videa vytvořena k tomu, aby zasahovala do voleb. Kanadské centrum pro kybernetickou bezpečnost totiž varuje, že „špatní aktéři“ plánují použít nástroje umělé inteligence k ovlivnění příštích federálních voleb, kdy každé jimi nasazené deepfake video nebude Kybernetické centrum schopno identifikovat.

Jinak řečeno, významné případy používání deepfakes podněcují diskuse o etice a bezpečnostních rizicích této technologie v celosvětovém měřítku. K odhalení deepfake videa dosud slouží takzvaný Deepfake index (index pravděpodobnosti digitálních úprav videa), který zkoumá 10 faktorů, které buď zvyšují pravděpodobnost, že je nahrávka autentická, nebo naopak poukazují na možnost, že se zde jedná o digitální úpravu, nebo dokonce uměle vytvořené video. Ovšem rozpoznat [7], zda jde u videí na internetu o autentickou, původní nahrávku, nebo jen tzv. deepfake, je podle expertů stále obtížnější. Proto třeba YouTube, jako největší internetový server pro sdílení videosouborů, přichází s novými pravidly, která mají ochránit diváky, aby si nepletli videa vytvořená nebo upravená pomocí nástrojů umělé inteligence se skutečností. Autoři budou povinni při nahrávání takový obsah označit a štítek pak bude viditelný v přehrávači. Přičemž pokračuje i vývoj počítačových programů, které mají nepřiznané deepfake klipy odhalit.

S deepfake videem se lze setkat i ve světě robotiky. Kdo se s takovým videem ještě nesetkal, může se podívat na ukázku, neinformovanými diváky zpravidla považovanou za čistou realitu. Zde vizualizace chování robota vznikala za pomoci tehdejšího stavu nástrojů umělé inteligence a prostřednictvím sdílení na internetu se šířila jako virál. Je třeba tu zdůraznit, že toto video se prvně objevilo na YouTube už 26. října 2019 (!) s dovětkem, že není vlastněno, podporováno, vytvořeno ani spojeno s americkou inženýrskou společností Boston Dynamics:

ODKAZY NA ZDROJE

[1] https://www.youtube.com/watch?v=gFQvL3KVaOQ

[2]https://neviditelnypes.lidovky.cz/spolecnost/kyberiada-era-robotickych-basniku.A240412_194536_p_spolecnost_nef

[3] https://cool.iprima.cz/filmy/indiana-jones-5-366468

[4] https://writeonsaga.com/home

[5] https://www.unrealengine.com/en-US/feed/all/animation

[6] https://www.youtube.com/watch?v=eeLAT6MIf04

[7] https://www.youtube.com/watch?v=t5pufwWX54o&t=6s