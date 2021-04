Ha creato Paul Walker digitale per Fast & Furious. E qui spiega come distingueremo i deepfake dalla realtà e quale valore avrà l’interazione vera

Hao Li ha scoperto l’esistenza dei deepfake come tutti noi: leggendo un articolo su Internet. Probabilmente, l’ha letto prima di molti altri, ma anche lui che da sempre lavora a livelli altissimi nella computer grafica, nello specifico nel campo della creazione di esseri umani digitali, non credeva che la tecnologia fosse già lì. In realtà, come ci ha spiegato, non è esattamente già arrivata, non ancora, però è evidente la prossimità del mondo alla creazione di immagini fotorealistiche di esseri umani in tutto e per tutto.

A oggi Hao Li è una delle persone più informate e attive in questo campo. Ha lavorato negli effetti visivi, è stato visiting professor alla WETA Digital e a capo della ricerca alla Industrial Light & Magic; è anche docente di Computer science all’università della Southern California. Soprattutto, è CEO di Pinscreen, società con cui lavora alla cattura di performance facciali in tempo reale e per la quale nel 2013 è stato premiato dal MIT di Boston. È evidente che questo campo ha trovato in Hollywood la vacca da cui mungere soldi e progetti, ma non necessariamente l’intrattenimento è l’applicazione del futuro. Tuttavia, per l’esperienza nel campo degli effetti visivi (ha creato Paul Walker digitale per Fast & Furious), Hao Li è stato invitato a parlare a VFXRio, il festival brasiliano degli effetti visivi.

Sappiamo creare paesaggi digitali perfetti, animali digitali perfetti, ma non umani perfetti, almeno non sempre: come mai?

“Gli esseri umani sono sempre stati complicati da ricreare in forma sintetica, negli ultimi 20 anni abbiamo visto esempi buoni ma anche pessimi. Sarà che ci li abbiamo sotto gli occhi tutti i giorni, li conosciamo bene e quindi notiamo ogni imperfezione nelle versioni digitali. È la vallata dell’incredulità: finché un personaggio sintetico è lontano dal fotorealismo, come per esempio un cartone, ci crediamo; più si prova ad avvicinarsi al fotorealismo più la sua credibilità cala, creando in un ipotetico grafico un avvallamento che inizia a risalire e a tornare al livelli normali di credibilità solo quando il fotorealismo è perfetto. Non c’è insomma un avvicinamento graduale, qualsiasi cosa, anche poco meno di perfetta, ci sembra totalmente implausibile”.

Che cosa è cambiato negli ultimi anni, quindi?



“Sono arrivati i contenuti generati da intelligenze artificiali: prima ci volevano artisti e studi di effetti digitali, ora tramite il deep learning possiamo insegnare alle macchine a usare dati reali per costruire modelli e allenarle così a creare volti umani che superino la vallata dell’incredulità”

L’abbiamo superata?



“Ci siamo quasi, in rari casi ce l’abbiamo fatta. Dipende se parliamo di produzioni importanti, come quelle per il cinema, in cui si lavora ad altissima risoluzione con problemi quali diverse illuminazioni e varie inquadrature: e lì non ci siamo. O se, invece, parliamo di esperimenti a bassa risoluzione solo frontali: qui ci siamo già. Comunque, lo sforzo produttivo è sempre richiesto, però non siamo ancora arrivati a una tecnologia buona per tutti”.

Dunque, Hollywood in certi casi ci è arrivata ma non abbiamo un’app?



“Prendiamo come esempio l’account DeepTomCruise di TikTok, il deepfake di Tom Cruise. Non è perfetto, eppure come spiegano gli autori stessi c’è un lavoro di produzione grosso dietro. Io credo che tuttavia possiamo arrivare in fretta a qualcosa di migliore e più semplice da realizzare”.

Quanto “in fretta”?

“Secondo me ci vuole meno di un anno per sviluppare uno strumento che usi i nuovi algoritmi per produrre umani fotorealistici in ogni situazione. Di fatto la tecnologia già esiste, bisogna solo capire se qualcuno si sta impegnando a costruire l’applicazione che la sfrutti”.

Pensi che riuscirai a vedere esseri umani credibili al 100% creati digitalmente prima di morire?



“Sì”.

Quale sarà la loro reale applicazione? Adora li usa il cinema e li usano i truffatori, che altro c’è?



“A oggi è una tecnologia di Facebook, usata per mostrare che esiste ed è possibile. Ci sono però tre aree in cui può essere applicata e della quale l’umanità può beneficiare: in primis le telecomunicazioni per sostituire le videoconferenza con gli ologrammi, cioè tu potresti avere un’immagine fotorealistica di me accanto a te e questo sarebbe molto più coinvolgente; per costruirla però dovresti avere un’immagine tridimensionale di te stesso già scannerizzata, un avatar in 3D (per il quale ti serve la tecnologia con cui si fanno i deepfake). La seconda area è la creazione di contenuti, dai film ai videogiochi fino alle esperienze coinvolgenti, insomma lo storytelling. La terza, infine, sono gli assistenti digitali, a oggi quelli solo vocali sono molto diffusi e funzionano bene in casa o in macchina, dove non vuoi distrazioni visive, ma in luoghi pubblici – per esempio – è meglio interagire con una figura umana piuttosto che con una voce. Ti faccio un altro esempio: pensa alla democratizzazione dell’istruzione, io potrei registrare le mie lezioni tramite il mio avatar tridimensionale e quelli che oggi sono corsi in video possono diventare corsi quasi di persona, con un’interazione che è più personale e stimola maggiormente l’attenzione”.

L’uso criminale è il primo quando si parla dei deepfake. Mentre sviluppiamo la tecnologia per renderli più semplici e convincenti, stiamo anche sviluppando quella per distinguere il falso dal vero?



“A oggi il 90% dei deepfake sono video porno con volti di celebrità, domani sarà la nuova generazione di phishing, truffe basate su immagini e video di persone che fingono di appartenere a certe aziende o essere altri per avere informazioni, è sempre più reale. È già accaduto un caso di una madre che ha molestato uno studente creando un deepfake di lui che fuma erba. L’idea al momento è di usare la stessa tecnica di deep learning con cui vengono prodotti gli effetti di deepfake per allenare i computer a distinguere la differenza tra il vero e il falso. Il problema è che è un metodo facile da aggirare, basta usare un algoritmo che il sistema non ha ancora elaborato e già non lo riconosce più. Solo l’educazione sarà uno strumento serio, sapere che queste tecnologie esistono e diffidare nella stessa maniera in cui oggi diffidiamo delle foto perché sappiamo che esiste Photoshop”.

Più avanziamo con la tecnologia più la sua assenza o la sua alternativa analogica guadagna in valore: quando la musica digitale è diventata ubiqua abbiamo riscoperto i vinili, quando gli effetti visivi dei film sono diventati quasi perfetti abbiamo apprezzato i veri stunt. Pensi che accadrà lo stesso con le repliche digitali di esseri umani?



“Ne parlo continuamente con gli altri studiosi e colleghi: se fosse possibile ricreare digitalmente qualsiasi cosa in totale fotorealismo che valore avrebbe il mondo reale? Guarda che cosa fa OpenAI con GPT3 e la creazione di testo automatico che sembra scritto da umani: ecco, immaginalo applicato al video. Arriveremo a non poter distinguere ciò che è vero da ciò che non lo è, e questo darà un incredibile valore all’interazione vecchio stampo a tu per tu, perché sarà l’unico modo di fidarsi di qualcuno. E io non credo che in sé questo sia un male”.