NIKON
TOPPS

OpenAI sospende la voce Sky: troppo simile a Scarlett Johansson. Risponde piccata l’attrice

Davvero un peccato, perché chi vi scrive sta provando il dialogo vocale con la rinnovata app di OpenAI per iOS, che è stata aggiornata al modello IA Gpt-4o, e consente di definire quale sintesi vocale utilizzare. Sky ci è piaciuta fin dal principio, non tanto perché così simile alla voce di Scarlett Johansson ma piuttosto perché quella con la sfumatura più gradevole. Certo, a ben sentire, parlare utilizzando la voce Sky era un po’ come entrare nel film Her, in cui Joaquin Phoenix si innamora di una intelligenze artificiale proprio con la voce della Johansson. Tra questa assurda somiglianza e le numerose questioni nate on-line sulla sintesi Sky, OpenAI ha optato per una scelta radicale. L’azienda che ha creato ChatGPT sta lavorando per mettere in pausa l’uso della voce Sky per le interazioni vocali con ChatGPT: troppe le segnalazioni di utenti che hanno sostenuto l’eccessiva somiglianza con la voce di Scarlett Johansson.

La società ha affermato che la voce, una delle cinque disponibili su ChatGPT, proveniva da un’attrice e non era stata scelta per essere una “imitazione” di Johansson, secondo un post sul blog. Come detto, Johansson ha interpretato un assistente virtuale immaginario nel film Her, un racconto distopico di come un uomo solo si innamora di un sistema di intelligenza artificiale (a sua volta “innamorato” di oltre 640 persone in contemporanea).

Nella nottata italiana, è arrivata la replica di Scarlett Johansson che spiega: “Quando ho ascoltato la demo pubblicata, sono rimasto scioccata, arrabbiata e incredula che il signor Altman volesse perseguire una voce che suonava così stranamente simile alla mia tanto che i miei amici più cari e i notiziari non riuscivano a notare la differenza. Il signor Altman ha addirittura insinuato che la somiglianza fosse intenzionale, twittando una sola parola “lei” (Her in inglese, ndr) – un riferimento al film in cui | ha doppiato un sistema di chat, Samantha, che forma una relazione intima con un essere umano (…) In un’epoca in cui siamo tutti alle prese con i deepfake e con la tutela della nostra immagine, del nostro lavoro, della nostra identità, credo che queste siano domande che meritano assoluta chiarezza. Attendo con impazienza una soluzione sotto forma di trasparenza e l’approvazione di una legislazione adeguata per contribuire a garantire la tutela dei diritti individuali”. Ecco la replica integrale dell’attrice che ricostruisce i fatti:

Il tema delle voci è così stringente perché sono una delle grandi novità di GPT-4o, il modello IA aggiornato di OpenAI, che ha debuttato all’inizio di questo mese e può rispondere alle domande verbali degli utenti con una risposta audio. L’azienda spiega così il lavoro eseguito sullo sviluppo delle voci:

“All’inizio del 2023, per identificare i nostri doppiatori, abbiamo avuto il privilegio di collaborare con direttori di casting e produttori indipendenti, noti e pluripremiati. Abbiamo lavorato con loro per creare una serie di criteri per le voci di ChatGPT, considerando attentamente la personalità unica di ciascuna voce e il loro fascino per il pubblico globale.

Alcune di queste caratteristiche includevano:

– Attori provenienti da contesti diversi o che potrebbero parlare più lingue
– Una voce che sembra senza tempo
– Una voce accessibile che ispira fiducia
– Una voce calda, coinvolgente, che ispira fiducia, carismatica con un tono ricco
– Naturale e facile da ascoltare

Nel maggio del 2023, l’agenzia di casting e i nostri direttori del casting hanno lanciato un bando di selezione per talenti. In meno di una settimana, hanno ricevuto oltre 400 proposte da doppiatori e attori cinematografici. Per l’audizione, agli attori è stata fornita una sceneggiatura delle risposte ChatGPT e gli è stato chiesto di registrarle. Questi esempi spaziavano dalla risposta a domande sulla consapevolezza al brainstorming sui piani di viaggio e persino al coinvolgimento in conversazioni sulla giornata di un utente.

Fino a maggio 2023, il team del casting ha esaminato e selezionato manualmente un elenco iniziale di 14 attori. Hanno ulteriormente perfezionato il loro elenco prima di presentare a OpenAI le loro voci migliori per il progetto.
Abbiamo parlato con ciascun attore della visione delle interazioni vocali uomo-intelligenza artificiale e di OpenAI e abbiamo discusso delle capacità, dei limiti e dei rischi connessi della tecnologia, nonché delle misure di salvaguardia che abbiamo implementato. Per noi era importante che ogni attore comprendesse la portata e le intenzioni della modalità vocale prima di impegnarsi nel progetto. Un team interno di OpenAI ha esaminato le voci dal punto di vista del prodotto e della ricerca e, dopo un’attenta considerazione, sono state finalmente selezionate le voci per Breeze, Cove, Ember, Juniper e Sky.

Nei mesi di giugno e luglio, abbiamo portato gli attori a San Francisco per sessioni di registrazione e incontri di persona con il prodotto OpenAI e i team di ricerca. Il 25 settembre 2023 abbiamo lanciato le loro voci in ChatGPT. L’intero processo ha richiesto un ampio coordinamento con gli attori e il team del casting, e si è svolto nell’arco di cinque mesi. Continuiamo a collaborare con gli attori, che hanno contribuito con ulteriore lavoro per la ricerca audio e nuove funzionalità vocali in GPT-4o”.

TOPPS
GAMEPEOPLE
DIFUZED
FIZZ
PALADONE
OTL
CROCKPOT
TOPPS
SUBSONIC