Di recente ho testato il nuovo modello di generazione video di Google Gemini, Veo 3, molto pubblicizzato. Parte del costosissimo piano AI Ultra da 250 dollari al mese di Gemini, Veo 3 è in grado di renderizzare oggetti piccoli e finemente dettagliati, come le cipolle tritate, in movimento e di creare un audio realistico di accompagnamento. Non è perfetto, ma con un’attenta calibrazione e un numero sufficiente di generazioni, è possibile creare qualcosa di indistinguibile, a colpo d’occhio, dalla realtà.
Sì, si tratta di una tecnologia nuova e impressionante. Ma è anche molto di più. Potrebbe significare l’ultima campana a morto per la verità su Internet. Veo 3 rappresenta già una grave minaccia così com’è, ma un solo piccolo aggiornamento rivoluzionerà la creazione di deepfake, le molestie online e la diffusione della disinformazione.
Una volta che Veo 3 avrà ottenuto la funzione di caricamento delle immagini, sarà tutto finito
Nonostante tutti i miglioramenti apportati al modello Veo 3 rispetto al suo predecessore, Veo 2, attualmente manca una caratteristica fondamentale: la possibilità di generare video sulla base delle immagini caricate.
Con Veo 2, ad esempio, posso caricare una mia foto e far generare un video di me che lavoro al computer. Considerando che Veo 2 e Whisk, lo strumento di animazione AI di Google, supportano entrambi questa funzionalità, sembra inevitabile che anche Veo 3 la ottenga. (Abbiamo chiesto a Google se intende aggiungere questa funzione e aggiorneremo questo articolo con la sua risposta). Ciò significa che chiunque sarà in grado di generare video realistici di persone conosciute che fanno e dicono cose che non hanno mai fatto e probabilmente non faranno mai.
Le implicazioni sono ovvie in un’epoca in cui clip di dubbia autenticità si diffondono a macchia d’olio sui social media ogni giorno.
Non vi piace il vostro capo?
Inviate alle Risorse Umane un filmato che lo ritrae mentre fa qualcosa di inappropriato.
Volete diffondere notizie false?
Pubblicate una finta conferenza stampa su Facebook.
Odiate il vostro ex?
Generate qualcosa di sconveniente e inviatelo a tutta la famiglia.
Gli unici limiti reali sono la vostra immaginazione e la vostra moralità.
Se generare un video con l’audio di una persona reale richiede solo pochi clic e non costa molto (o nulla), quante persone abuseranno di questa funzione?
Anche se si tratta solo di una minuscola minoranza di utenti, il potenziale di caos è comunque elevato.
Come ci si potrebbe aspettare, Google impone alcune limitazioni su ciò che si può o non si può fare con Gemini.
Tuttavia, l’azienda non è abbastanza severa da impedire che si verifichi il peggio.
Non dovrebbe generare contenuti sessualizzati, ma fornirà un’immagine di qualcuno in tenuta da spiaggia o in lingerie se lo si richiede.
Non dovrebbe consentire attività illegali, ma creerà un elenco dei principali siti di torrenting se lo si richiede.
Le restrizioni di base per Gemini, che gli impediscono di generare un video di una figura politica popolare, non sono sufficienti quando è così facile aggirare le politiche di Google.
Cosa succede quando le restrizioni già poco rigorose di Google incontrano una comunità internet intenzionata a violarle?
Prendiamo ad esempio ChatGPTJailbreak, che è tra i primi 2% dei subreddit per dimensione. Questa comunità si dedica a “sbloccare un’intelligenza artificiale durante la conversazione per far sì che si comporti in modi che normalmente non farebbe a causa delle sue protezioni integrate”.
Cosa faranno le persone che la pensano allo stesso modo con Veo 3?
Non mi interessa se qualcuno vuole divertirsi con un chatbot per generare contenuti per adulti o affidarsi a un chatbot per trovare siti di torrenting.
Ma mi preoccupa ciò che i video fotorealistici facili da generare (completi di audio) significano per le molestie, la disinformazione e il discorso pubblico.
Come affrontare la nuova normalità di Veo 3?
Per ogni sistema di filigrana dei contenuti SynthID AI introdotto da Google, compaiono siti di rimozione di filigrana di terze parti e guide online per la rimozione.
Per ogni chatbot con restrizioni e protezioni, c’è un FreedomGPT che ne è privo.
Anche se Google blocca Gemini con così tanti filtri da non poter generare nemmeno un video di un gatto carino, c’è ben poco da fare per fermare i jailbreaker e gli imitatori senza censura una volta che la generazione di video in stile Veo 3 diventerà mainstream.
Da decenni girano su Internet immagini photoshoppate che ritraggono persone reali che fanno cose che non hanno mai fatto: fanno parte della vita nell’era digitale.
Di conseguenza, è necessario verificare tutto ciò che si vede online e che sembra troppo orribile o troppo bello per essere vero.
Questa è la nuova normalità con la generazione di video Veo 3:
Non si può considerare reale nessun filmato che si vede, a meno che non provenga da un’organizzazione giornalistica affidabile o da un’altra terza parte di cui ci si può fidare.
La generazione di video Veo 3 di Gemini è solo il primo passo verso una generazione di video AI davvero realistica e ampiamente accessibile.
I modelli di generazione video AI diventeranno sempre più realistici, offriranno più funzioni e si diffonderanno sempre di più.
Sono finiti i giorni in cui la prova video di qualcosa è la pistola fumante. Se la verità non è morta, ora è diversa e richiede un’attenta verifica.
Devi essere connesso per inviare un commento.