Voice Engine di OpenAI clonerà una voce in appena 15 secondi!

OpenAI ha sviluppato un nuovo strumento basato sull’intelligenza artificiale, chiamato Voice Engine, che promette di clonare voci umane partendo da un campione audio di soli 15 secondi. Questo strumento, la cui fase di sviluppo è iniziata nel 2022, trova applicazione in diversi ambiti, inclusi il supporto alla traduzione linguistica e l’aiuto a persone con problemi di linguaggio.

Voice Engine funziona come un modello di intelligenza artificiale testo-voce che, analizzando un breve audio, è capace di ricreare una voce umana capace di leggere qualsiasi testo con espressività. Le sue applicazioni sono variegate: dalla traduzione di contenuti preservando la voce originale del parlante, alla creazione di avatar digitali che riproducono non solo l’aspetto ma anche la voce della persona reale, fino a ridare la voce a chi l’ha persa.

Tra le aziende che hanno accesso a questa tecnologia ci sono Age of Learning, HeyGen, Dimagi, Livox e Lifespan, operanti in ambiti che spaziano dalla tecnologia educativa alla sanità.

OpenAI può clonare la voce di una persona. Voice Engine ha bisogno solo di 15 secondi di un campione audio

Le potenzialità di Voice Engine sono molteplici, spaziando dalla traduzione di contenuti mantenendo la voce originale del parlante, alla creazione di avatar digitali che emulano sia l’aspetto fisico sia la voce di una persona reale, fino al restituro della voce a individui che l’hanno perduta.

Nonostante l’ampio ventaglio di applicazioni, OpenAI ha scelto di non rilasciare pubblicamente questa tecnologia a causa di preoccupazioni legate alla sicurezza. Tuttavia, alcune aziende hanno già accesso a Voice Engine, tra cui Age of Learning, HeyGen, Dimagi, Livox e Lifespan, che operano in settori vari come l’educazione, la narrazione visiva, il software sanitario e la comunicazione.

OpenAI, nota per ChatGPT, si afferma nel campo degli assistenti vocali con questa nuova tecnologia, segnalando una fase di anteprima su piccola scala iniziata nel 2022. Nonostante la presenza di altre IA con funzionalità simili, l’ingresso di OpenAI in questo ambito con Voice Engine è considerato un cambiamento significativo.

L’IA che clona le voci è preoccupante. Ma se appartiene a OpenAI lo è ancora di più

Il modello di deep learning chiamato Voice Engine, sviluppato da OpenAI, ha suscitato preoccupazioni per la sua capacità di clonare la voce di una persona da un campione audio di soli 15 secondi. Questa tecnologia, che imita perfettamente caratteristiche vocali come altezza, timbro, ritmo, e intonazione, promette applicazioni variegate come la traduzione di contenuti preservando la voce originale e la creazione di avatar digitali con voci realistiche.

Tuttavia, la facilità d’uso e l’accessibilità di questa tecnologia, specie considerando l’ampio utilizzo di strumenti come ChatGPT di OpenAI, sollevano questioni etiche e di sicurezza significative. Mentre alcune aziende come Age of Learning, HeyGen, Dimagi, Livox, e Lifespan hanno già accesso a questa tecnologia, la sua diffusione solleva interrogativi sulla potenziale uso improprio, come la creazione di fake news o la violazione della privacy individuale.

OpenAI ha avviato lo sviluppo di Voice Engine dalla fine del 2022, addestrandolo con un mix di dati pubblici e concessi in licenza, senza tuttavia divulgare ulteriori dettagli. Sebbene le potenzialità di questa tecnologia siano vastissime, la sua natura preoccupa non solo per le implicazioni sulla privacy e l’autenticità della comunicazione ma anche per le potenziali applicazioni malevoli.

Aegomenti Correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Scroll to Top