Catégories
italie

Meta Tool ricrea la voce della persona in pochi secondi –

COME migliori offerte,
nessuna coda attaccata

Meta ha annunciato lo sviluppo di uno strumento di intelligenza artificiale in grado di generare il linguaggio umano. Il modello necessita di essere fornito con alcune frasi registrate dall’utente. Successivamente, Voicebox ti consente di creare nuovi audio dal testo scritto. Lo stesso Mark Zuckerberg è apparso, in una clip diffusa via Instagram, parlando un buon portoghese – con una “s” molto carioca nella parola “tutto”. Tutto generato dall’intelligenza artificiale.

Nel 2023, l’obiettivo principale di Meta sarà l’intelligenza artificiale (Immagine: Vitor Pádua/)

Secondo il conglomerato digitale, bastano solo 2 secondi di campionamento audio affinché il sistema sia in grado di produrre nuove linee. L’idea è quella di realizzare il sintesi vocale per evitare il fastidio di ri-registrare eventualmente tutto il materiale audio.

Sempre secondo l’azienda, la tecnologia consentirebbe alle persone ipovedenti di ascoltare i messaggi degli amici o che i personaggi del gioco non giocabili – i famosi NPC – abbiano una voce. Voicebox potrebbe anche fornire suoni naturali per gli assistenti vocali.

Guardalo in azione nel video qui sotto:

Facile modifica dei contenuti

Un altro punto importante riguarda la modifica dei contenuti. Nell’esempio, Zuckerberg sta registrando l’audio quando si sente un clacson. Lo strumento, però, riesce a “pulire” il materiale. Al giorno d’oggi ci sono software professionali e altri software amatoriali con una funzione simile, quindi resta da vedere come la funzione raggiungerà le applicazioni di Meta.

Per inciso, la società non ha fatto alcun annuncio ufficiale dell’implementazione di Voicebox su Instagram, WhatsApp o Facebook. Per ora, tutto fa pensare che Zuckerberg voglia solo dimostrare i progressi che l’azienda sta facendo nel campo dell’IA generativa. Questo è l’obiettivo principale al momento, insieme allo sviluppo (a lungo termine) nelle tecnologie del metaverso.

Anche la concorrenza agisce

Meta non è solo nella ricerca e nello sviluppo di IA generativa per la voce. L’annuncio di questo venerdì mi ha ricordato Vall-E, un sistema introdotto da Microsoft a gennaio con la proposta di ricevere brevi audio, dalla persona che parla, per generare nuovi file.

Vall-E richiede solo un campione di tre secondi (Immagine: Disclosure/Microsoft)

Apple, invece, ha presentato una funzionalità chiamata Personal Voice al WWDC 2023, tenutosi la scorsa settimana. Sarà in iOS 17. Come parte degli sforzi per l’accessibilità, gli utenti saranno in grado di leggere ad alta voce uno script di frasi. Successivamente, il sistema iPhone ricreerà la voce sintetizzata della persona. La tecnologia di Apple, tuttavia, richiede circa 15 minuti di registrazione originale.

Con informazioni: Meta, Facebook Research e 9to5 Mac

AppleFacebookInstagramIntelligenza ArtificialeiPhoneLLMMark ZuckerbergMetaMicrosoftPortuguêsWhatsAppiOSWWDC

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *