Cos’è l'uncanny valley? Google, Veo 3 e l'intelligenza artificiale che crede di essere reale

Google ha presentato il nuovo Veo 3, un modello di intelligenza artificiale capace di generare video molto realistici. Si tratta di una tecnologia in grado di creare clip animate con un livello di definizione, coerenza visiva e cura dei dettagli sorprendentemente avanzato rispetto agli standard precedenti. Fin dalla sua presentazione, Veo 3 è stato giudicato più potente di altri strumenti simili, in particolare rispetto a Sora di OpenAI, lanciato alla fine del 2024. Il confronto diretto tra i due ha evidenziato il livello raggiunto in breve tempo in questo ambito: Veo 3 produce risultati ancora più credibili rispetto a tutti i principali tool concorrenti, già di per sé molto sofisticati. Una modalità ricorrente usata per valutare l’efficacia di questi sistemi è richiedere di realizzare un video di «Will Smith che mangia degli spaghetti», un format diventato ormai un meme tra gli appassionati di AI. Se nel 2023 le immagini ottenute risultavano approssimative, sgranate e poco realistiche, oggi lo stesso prompt restituisce una scena quasi indistinguibile rispetto a una ripresa autentica. Nonostante le sue capacità avanzate, l’uso di Veo 3 è comunque semplicissimo: basta scrivere una descrizione testuale per ottenere una clip coerente e rifinita nei dettagli. A supporto di questo strumento, Google ha anche presentato Flow, un video editor che modifica automaticamente i contenuti generati con Veo 3 solo tramite comandi scritti.

@impossibleaicinema AI asks the people of Ancient Rome what life was like! #ancientrome #historytime #roman #ancienthistory #streetinterview original sound - Impossible AI

Una delle caratteristiche più interessanti del nuovo strumento di Google è la possibilità di inserire elementi sonori all’interno delle clip: tramite semplici input testuali si riescono potenzialmente a prevedere rumori ambientali complessi e persino dialoghi tra i personaggi generati. Questo approccio permette di ottenere contenuti video fatti e finiti, senza ricorrere ad alcuna registrazione audio o doppiaggio successivo. Non a caso, in seguito al lancio, i principali social network si sono rapidamente popolati di contenuti generati con Veo 3. Ad esempio, alcuni di questi filmati imitano fedelmente il formato e il tono dei telegiornali, mostrando immagini, didascalie e speaker realistici; altri riproducono interviste in stile pop vox, come quelle popolarmente diffuse su TikTok e Instagram. In questo contesto, un sottogenere particolarmente discusso è quello dei video in cui personaggi fittizi, generati con l’IA, negano di essere artificiali, alimentando un senso di ambiguità e straniamento. Di fronte a questo fenomeno molte persone hanno iniziato a utilizzare il termine inglese uncanny valley, ovvero quella particolare sensazione di disagio che si prova quando qualcosa di artificiale appare sorprendentemente umano. In tal senso, i video realizzati con Veo 3 che mostrano individui rispondere a domande come se fossero reali, o difendersi dall'accusa di non esserlo, hanno suscitato parecchia inquietudine tra gli utenti.

Il cinema e la televisione, ma anche l'animazione e altre branchie dell'audiovisivo, guardano con crescente preoccupazione queste tecnologie, che potrebbero cambiare radicalmente il mercato. Nel 2023 lo sciopero degli attori e sceneggiatori di Hollywood aveva riguardato anche il crescente utilizzo dell’AI. La possibilità di realizzare scene complesse a costi contenuti, senza ricorrere a set, attori o troupe di tecnici, potrebbe portare benefici economici agli studi di produzione, ma anche conseguenze negative per chi lavora nel settore. Un esempio recente di utilizzo massiccio di questi strumenti si è visto al concerto di Liberato al Circo Massimo di Roma, il 31 maggio: durante l’evento, gran parte dei visual proiettati erano evidentemente stati generati sfruttando l’AI. La scelta per certi versi ha diviso il pubblico. Alcuni spettatori hanno successivamente criticato sui social il risultato estetico, giudicandolo caotico e poco coerente con lo stile che aveva distinto le precedenti performance dal vivo dell’artista. Non è ancora chiaro quanto velocemente tali tecnologie saranno adottate su larga scala, né se sostituiranno del tutto o in parte il contributo umano, ma nel settore la preoccupazione è concreta. Più che una minaccia immediata, Veo 3 e strumenti simili vengono percepiti come segnali di un forte cambiamento in atto, che nei prossimi anni potrebbe ridefinire radicalmente il modo in cui vengono prodotti i contenuti visivi.