NIKON
PANTHEK

L’intelligenza artificiale “etica” Firefly di Adobe è stata addestrata con immagini di Midjourney

Quando Adobe ha rilasciato lo scorso anno il suo software di generazione di immagini Firefly, la società aveva dichiarato che il modello di intelligenza artificiale è stato addestrato principalmente su Adobe Stock cioè il suo database di centinaia di milioni di immagini con licenza. Firefly, spiega Adobe, è un’alternativa “commercialmente sicura” ai concorrenti come Midjourney, che ha imparato raschiando immagini da Internet. Ma dietro le quinte, Adobe si affidava in parte anche ai contenuti generati da altre intelligenze artificiali per addestrare la IA Firefly, anche da parte degli stessi rivali dell’intelligenza artificiale. In numerose presentazioni e post pubblici su come Firefly sia più sicuro della concorrenza grazie ai suoi dati di addestramento, Adobe non ha mai chiarito che il suo modello utilizzasse effettivamente immagini di alcuni di questi stessi concorrenti.

Sono necessarie enormi quantità di dati per addestrare i modelli di intelligenza artificiale alla base dei prodotti di creazione di contenuti più diffusi e vi è un crescente controllo sulle aziende tecnologiche di intelligenza artificiale sulla fonte dei materiali che sono impiegati per questa fase di addestramento, per comprendere come gestire i contenuti protetti da copyright nel processo. Aziende come Midjourney, OpenAI, produttore di Dall-E, e Stability AI, produttore di Stable Diffusion, hanno costruito i loro modelli di generazione di media con set di dati che estraggono immagini da Internet, una pratica che ha suscitato indignazione e azioni legali da parte di numerosi artisti.

“Ciò mette in luce la parte oscura della definizione di intelligenza artificiale ‘responsabile’ e illustra anche le difficoltà di allontanarsi, se non da problemi legali, almeno sociali e culturali, o problemi etici, con i contenuti generati”, ha affermato Luke Stark, un assistente professore alla Western University in Ontario, che studia gli impatti sociali ed etici dell’intelligenza artificiale.

La decisione di Adobe di creare la IA Firefly con contenuti di cui l’azienda detiene i diritti e che sono di pubblico dominio aveva lo scopo di differenziare il suo strumento di immagine basato sull’intelligenza artificiale in un contesto di mercato in rapida crescita della IA generativa. L’azienda l’ha promossa come un’opzione più etica e giuridicamente valida per i clienti interessati a evocare immagini da poche parole ma diffidenti nei confronti di potenziali problemi di copyright. Non genererà contenuti basati sulla proprietà intellettuale di altre persone o marchi, ha sempre affermato Adobe, ed eviterà anche di produrre immagini dannose.

I contenuti generati dall’intelligenza artificiale sono entrati nel set di formazione di Firefly perché ai creatori era consentito caricare milioni di immagini su Adobe Stock. “Le immagini dalla IA generative della raccolta Adobe Stock sono una piccola parte del set di dati di formazione Firefly“, ha scritto la rappresentante di Adobe Michelle Haarhoff a settembre in un gruppo Discord per fotografi e artisti che contribuiscono al mercato.

Adobe sostiene che una quantità relativamente piccola – circa il 5% – delle immagini utilizzate per addestrare il suo strumento di intelligenza artificiale è stata generata da altre piattaforme di intelligenza artificiale. “Ogni immagine inviata ad Adobe Stock, incluso un sottoinsieme molto piccolo di immagini generate con l’intelligenza artificiale, passa attraverso un rigoroso processo di moderazione per garantire che non includa IP, marchi, caratteri o loghi riconoscibili o nomi di artisti di riferimento”, ha dichiarato un portavoce dell’azienda.

Le critiche alla pratica sono arrivate dall’interno dell’azienda: fin dai primi giorni di Firefly, c’è stato un disaccordo interno sull’etica e sull’ottica dell’inserimento di immagini generate da altre intelligenze artificiali nel modello di IA di Adobe. Questo secondo le fonti raccolte da Bloomberg, fonti che hanno chiesto di rimanere anonime. Alcune di queste fonti hanno suggerito di eliminare dal sistema le immagini generate da altre IA, ma una delle persone ha detto che al momento non ci sono piani per farlo.

Adobe ha criticato i concorrenti per le loro pratiche di raccolta dati. Altri modelli si basano su dati “apertamente raccolti”, ha affermato l’anno scorso il Chief Strategy Officer Scott Belsky. Un motivo per cui Firefly è migliore del modello comparabile di OpenAI è perché mostra rispetto per la comunità creativa formandosi solo su dati concessi in licenza o disponibili gratuitamente, afferma Adobe sul suo sito web . E in un post sul blog dello scorso marzo intitolato “Innovazione responsabile nell’era dell’intelligenza artificiale generativa”, il consigliere generale Dana Rao ha sottolineato che l’intelligenza artificiale generativa “è valida quanto lo sono i dati su cui è stata formata”. “La formazione su set di dati selezionati e diversificati conferisce intrinsecamente al tuo modello un vantaggio competitivo quando si tratta di produrre risultati commercialmente sicuri ed etici”, ha scritto, sottolineando che Adobe ha formato Firefly su immagini stock Adobe, contenuti concessi in licenza e contenuti di pubblico dominio in cui il i diritti d’autore sono scaduti. “I nostri clienti aziendali sono venuti da noi quando abbiamo lanciato Firefly e ci hanno detto: ‘Amiamo ciò che fate, apprezziamo davvero che non stiate rubando tutta la nostra proprietà intellettuale su Internet'”, ha speigato Ashley Still, vicepresidente senior di Adobe.

Tuttavia, Adobe non ha mai chiarito pubblicamente che Firefly si era formato in parte su immagini provenienti da strumenti della concorrenza presumibilmente meno etici. E ha delineato tali dettagli in almeno due gruppi di discussione online che l’azienda gestisce su Discord – uno per Adobe Stock e un altro dedicato a Firefly – secondo i messaggi visualizzati da Bloomberg. Nel marzo 2023, Adobe ha presentato Firefly come prodotto “beta”. Quel mese, Raúl Cerón, che lavora con la community di Adobe Stock, ha pubblicato su Discord che la società non aveva intenzione di utilizzare le immagini generate per addestrare la prossima versione pubblica di Firefly. “Una volta che la beta sarà uscita, avremo un nuovo database di formazione, lasciando fuori i contenuti della generazione AI”, ha scritto in un post a giugno.

Quando Adobe ha annunciato il rilascio pubblico di Firefly il 13 settembre, la società ha anche pagato uno speciale “bonus Firefly” ai contributori di Adobe Stock “il cui contenuto è stato utilizzato per addestrare il primo modello Firefly commerciale”. I contributori che hanno utilizzato l’intelligenza artificiale generativa sono stati tra quelli che hanno ricevuto il pagamento del bonus, secondo un messaggio Discord di Mat Hayward, che lavora anche con la community di Adobe Stock. Le immagini generate dall’intelligenza artificiale in Adobe Stock “migliorano il nostro modello di training del set di dati e abbiamo deciso di includere questo contenuto per la versione commerciale di Firefly”, ha scritto Hayward.

Brian Penny, scrittore e collaboratore che ha inviato ad Adobe Stock migliaia di immagini generate dall’intelligenza artificiale, per lo più realizzate con Midjourney, è rimasto sorpreso di ricevere il bonus. Ha pensato che come collaboratore di AI non sarebbe stato idoneo. Nonostante il guadagno finanziario, Penny ritiene che la decisione di addestrare Firefly su contenuti come il suo sia negativa e ha affermato che la società dovrebbe essere più sincera su come sta addestrando il software per la creazione di immagini. “Devono essere etici, devono essere più trasparenti, devono fare di più”, ha affermato.

La libreria di Adobe Stock ha avuto un boom da quando ha iniziato ad accettare formalmente i contenuti IA alla fine del 2022. Oggi ci sono circa 57 milioni di immagini, ovvero circa il 14% del totale, etichettate come immagini generate dall’IA. Gli artisti che inviano immagini generate con l’intelligenza artificiale devono specificare che l’opera è stata creata utilizzando la tecnologia, anche se non è necessario che dicano quale strumento hanno utilizzato. Per alimentare il suo set di formazione sull’intelligenza artificiale, Adobe si è anche offerta di pagare i contributori per inviare una quantità enorme di foto per la formazione sull’intelligenza artificiale, come immagini di banane o bandiere.

La formazione sui contenuti generati dall’intelligenza artificiale probabilmente non renderebbe il generatore di immagini Firefly di Adobe meno sicuro dal punto di vista commerciale, e l’azienda non è tenuta a dire su cosa si sta formando purché non fornisce informazioni fuorvianti ai consumatori, ha affermato la professoressa di Harvard Rebecca Tushnet , che si concentra sul diritto d’autore e sulla pubblicità. Ma la formazione sulle immagini IA, come quelle create da Midjourney, mina l’idea che Firefly sia unico rispetto ai servizi concorrenti. Ha detto: “Adobe sostanzialmente vuole posizionarsi come alternativa superiore, ma vuole anche input davvero economici, e l’intelligenza artificiale è davvero un ottimo modo per ottenere input a basso costo”.

PANTHEK
GAMEPEOPLE
DIFUZED
FIZZ
PALADONE
OTL
CROCKPOT
MYSTERY BOX
SUBSONIC