Ora ti basterà parlare per trasformare le parole in video: il nuovo prodigio della AI

Si chiama Make-A-Video ed é il nuovo risultato raggiunto da Meta sfruttando l’intelligenza artificiale. La sua caratteristica: trasforma descrizioni testuali in video di alta qualità ed è stato ottenuto grazie alla ricerca effettuata dall’azienda nell’ambito della tecnologia generativa. Ecco i dettagli.

Make-A-Video ComputerMagazine.it 30 Settembre 2022
Un dei primi frame di un video realizzato tramite Make-A-Video di Meta – ComputerMagazine.it

Nella giornata di ieri, Giovedì 29 Settembre, Meta ha annunciato Make-A-Video, un nuovo sistema di generazione di video di alta qualità a partire da una descrizione testuale, basato sull’intelligenza articiale.

Il sistema è il risultato della ricerca effettuata dalla divisione dedicata all’AI di Meta, che ha sfruttato la tecnologia generativa – recentemente balzata all’onore delle cronache per software di generazione d’immagini come Dall-E e Imagen – applicandola all’ambito del videomaking.

Una tecnologia su cui l’azienda è decisa a puntare sempre di più, per ampliare lo spettro delle possibilità di creazione di contenuti con l’ausilio dell’intelligenza artificiale. La quale agisce, come dichiarato da Meta stessa, sempre più per “modelli imitativi” delle capacità cognitive dell’uomo: “Così come noi impariamo rapidamente a riconoscere persone, luoghi, cose ed azioni attraverso l’osservazione, i sistemi generativi saranno più creativi e utili se possono mimare il modo in cui imparano gli uomini”, ha dichiarato in un comunicato ufficiale.

Le tecniche di generazione di video di Make-A-Video

Make-A-Video Meta ComputerMagazine.it 30 Settembre 2022
Un frame di una clip di test realizzata da Make-A-Video di Meta – ComputerMagazine.it

Proprio come per la tecnologia generativa multimodale dedicata alla creazione di immagini, battezzata T2I (“Text To Image”), la tecnologia generativa dedicata alla creazione di video si basa sull’analisi e sull’interpretazione di un testo per comporre una clip dinamica con gli elementi in esso descritti. Oltre al testo, possono essere utilizzati anche altri video e fotografie.

E’ stata battezzata T2V (“Text To Video”) e, pur essendo un tecnologia alle sue primissime fasi di sviluppo, sta mostrando risultati sorprendenti. E, al contempo, un potenziale di applicazione assai ampio, dal settore della divulgazione a quello della produzione video.

Non mancano, tuttavia, anche perplessità e dubbi, in particolare riguardo alla possibilità di un utilizzo improprio dei software basati sulla tecnologia: secondo molti osservatori, infatti,  potrebbero alimentare la produzione di deep fake, fake news e contenuti diffamatori ed offensivi, come già successo con i generatori d’immagini. Nonché tendere a sostituirsi all’uomo, sottraendogli più ancora che facilitandogli, compiti e mansioni. 

 

? FONTE: www.hdblog.it

Impostazioni privacy