L’intelligenza artificiale in fotografia: cambierà i paradigmi di vita?
Gli ultimi progressi nel campo della fotografia digitale sono avvenuti a una velocità supersonica che ormai ci sentiamo sempre più vicini alla famosa serie STAR TREK: ci mancano il teletrasporto e un paio di Vulcaniani e siamo a posto.
Le grandi aziende stanno finanziando da anni la ricerca nel settore per dotare i propri dispositivi smartphone di telecamere più potenti, chip all’avanguardia e sistemi di Intelligenza Artificiale sempre più sensibili.
Oramai è piuttosto inutile lamentarsi del fatto che anche un idiota possa creare immagini piacevoli, possiamo dire che sia obsoleto perdere tempo in imprecazioni contro la tecnologia che ha abbassato la qualità della fotografia. E’ vero ma non è neanche poi così vero. E’ un discorso complicato. La mutazione avviene dal giorno del BIG BANG nello spazio, ogni giorno fa invecchiare quello precedente, o ne prendiamo atto o resteremo ancorati al bitume di Giudea.
(n.d.r. Idrocarburo impiegato nella pratica delle incisioni a morsura delle matrici da stampa in quanto si altera alla luce solare e esposto ai raggi schiarisce in proporzione alla loro intensità. )
Siamo nell’era dell’intelligenza artificiale ed è necessario capire come questa nuova modalità possa essere utilizzata e sfruttata dal professionista e non osteggiata, sarebbe sciocco.
L’I.A è arrivata ad un livello di ottimizzazione delle fotografie superiore a qualunque aspettativa uno avesse avuto anche solo 10 anni fa, come ad esempio generare file in alta risoluzione per salvarli e ridurli tantissimo senza perdere qualità, questa cosa che ci sembra ovvia è già una possibilità donata dalle nuove tecnologie. Da uno smartphone possiamo avere file in alta risolizione che occupino pochissima memoria ma per poi raggiungere ingrandimenti incredibili.
L’ultima frontiera, al momento, è quella di cui tutti parlano,ovvero la possibilità di generare incredibili immagini solamente descrivendo ciò che desideriamo vedere. Più siamo bravi e precisi nell’inserire i dati e più sarà straordinario il risultato. L’intelligenza Artificiale che genera immagini.
Per fare delle prove esercitatevi con Crayon, Dall-E 2, Midjourney, Dream, StarryAI, Imagen, Parti.
Sono programmi con I.A. addestrati per generare immagini da descrizioni di testo immesse dagli utenti. Si tratta di prodotti sempre più avanzati, in grado di creare disegni e grafiche degni di un professionista. La novità sta creando qualche preoccupazione nel mondo artistico, in particolare fra i creatori di immagini che si chiedono se presto saranno senza lavoro. Al momento solo Crayon è disponibile liberamente al grande pubblico, ma è difficile non chiedersi cosa accadrà una volta che i modelli con intelligenza artificiale saranno a tutti gli effetti lanciati nel mercato. Vedremo cose da far girare la testa.
In effetti i risultati lasciano esterrefatti. I paradigmi stanno davvero cambiando e dobbiamo accelerare le nostre sinapsi per capire come poter utlizzare questi elementi creativi senza farci schiavizzare dalla banalità del gesto.
Secondo Mar Hicks, professore presso l’Illinois Institute of Technology che studia la storia della tecnologia, questo sistema è tanto divertente quanto pericoloso. Craiyon, infatti, genera sempre un’immagine dalla descrizione, invece di filtrare alcune descrizioni mostrando un errore. Hicks è preoccupato per la capacità del sistema di intelligenza artificiale di rispondere a qualsiasi richiesta scritta. Ciò può alimentare alcuni stereotipi, poiché l’I.A. si basa su dati provenienti da internet, il che significa che le immagini che creano possono anche mettere a nudo una serie di pregiudizi tra cui genere, razza e stereotipi sociali.
Anche questi sono problemi da tenere presente per l’effetto domino che questa ennessima rivoluzione porterà.
Io ero già assolutamente stupefatto quando capii come funziona SIRI, e poi dal fatto che potevi dettare a voce e le parole si scrivevano da sole sul testo bianco del computer. Adesso resto basito quando uso il traduttore per parlare con amici ucraini, parliamo dentro ad un coso e ci capiamo. Ogni mese c’è un salto nell’iperspazio che si fa quasi fatica a reggere, almeno per gli over 50, mi spiego, anche se non siamo di quelli che prendono male ogni nuova innovazione tecnologica, ma al contrario ci piace essere sorpresi, è davvero faticoso prenderne atto, entrarci denro per capirne le potenzilaità e poi tradurle in possibilità creative, perché poi alle fine, diciamolo, per gli autori che adorano spaziare il più possibilie oltre ogni frontiera, la ricerca è sempre quella, quella che ci fa dire: “Ok, bella sta cosa, ma come la posso usare? Cosa ci posso produrre? Dove mi porterà ad immaginare? Quali confini rompe e quali limiti potrebbe avere?”
E oggi siamo di fronte a nuove domande di questo tipo, è diventato possibile far creare immagini ad una macchina semplicemente fornendole delle minime indicazioni testuali. Il passaggio da testo ad immagine è strabiliante ed è immediata la “magia” della creazione, da qui non ci si più non interrogare sull’origine della creatività, sul significato di arte e di autore. Io non sono minimamente interessato a come funzionanino queste tecnologie e non ne ho le competenze neanche per ascoltare chi le sa e prova a spiegarmele, però ho trovato dei testi che provano a sintetizzare il funzionamento, ve le copioicollo qui per chi avesse questa voglia e capacità.
Come funzionano i generatori di immagini.
I generatori di immagini sono basati su reti generative avversarie o GAN (Generative Adversarial Networks). Si tratta di architetture nelle quali due reti neurali si sfidano in una sorta di gioco a somma zero. La rete detta Generatore, partendo da numeri casuali, ha il compito di elaborare immagini realistiche, provando ad ingannare il Discriminatore. La rete Discriminatore viene addestrata a riconoscere immagini preesistenti, attraverso l’analisi di milioni di esempi etichettati appropriatamente, con l’obiettivo di capire se quelle prodotte dal Generatore sono reali o artificiali. Pian piano, di tentativo in tentativo, il Generatore impara a produrre immagini sintetiche che sembrano create da un umano.
I sistemi più evoluti di “text to image”, come quelli di OpenAI e Imagen di Google, usano dei “diffusion model”. Entrambi partono da un modello in grado di comprendere delle frasi complesse, non semplici parole chiave.
Nel sistema di OpenAI queste frasi vengono passate a dei calcolatori che usano un modello, detto “prior”, che ha il compito di generare “CLIP image embeddings” ossia di “farsi un’idea” di quelle parole (come succede a noi umani quando ci chiedono di disegnare una spiaggia con degli ombrelloni e delle barche all’orizzonte). Poi queste “CLIP image embeddings” vengono passate ad un’altra rete che, sulla base di un “Decoder Diffusion model” (unCLIP), inizia a disegnare quell’idea per passi successivi (vedi video in basso).
Anche Imagen di Google usa un “diffusion model”, mentre il nuovo Parti usa un “autoregressive model” per trasformare le parole in immagini con un codificatore di testo che attinge a 20 miliardi di parametri (dettagli tecnici).
Fonte: VINCOS BLOG
In questo momento i programmi di generazione di immagini più sofisticati sono in fase di sperimentazione. Prima di essere rilasciati a tutti, ne vanno studiati i rischi di utilizzo come la produzione di contenuti violenti o falsi che possono mettere in cattiva luce determinate persone o categorie e la generazione di output che possono riflettere i pregiudizi e gli stereotipi contenuti nei modelli linguistici di grandi dimensioni.
Prima o poi questi software diventeranno di dominio pubblico, si moltiplicheranno ed evolveranno e probabilmente entro cinque anni li vedremo applicati anche ai video.
C’è da aspettarsi che creeranno problemi alle agenzie di stock images, mi sembra ovvio, di certo resterà da capire la storia dei diritti d’autore: chi, cosa, come, a chi, e sarà una bella matassa da sciogliere!
Ad ogni modo, nonostante stiano già piovendo molte critiche, io resto convinto che questi strumenti basati sull’Intelligenza Artificiale non distruggeranno la creatività, ma al contrario potranno moltiplicare idee e gesti degli autori più curiosi e desiderosi di crescere senza confini.
Altri articoli di questa rubrica
Fotografo ritrattista. Venti anni di esperienza nella fotografia di “people” spaziando dal ritratto per celebrity, beauty, adv e mantenendo sempre uno sguardo al reportage sociale.
Ha coordinato il dipartimento di fotografia dell’Istituto Europeo di Design ed è docente di Educazione al linguaggio fotografico presso la Raffles School, Università di design di Milano.
Il suo portfolio comprende lavori autoriali e commerciali per FIAT, Iveco, Lavazza, Chicco, Oréal e la pubblicazione di quattro libri fotografici: “Ecce Femina” (2000), “99 per Amnesty” (2003),
“La Soglia. Vita, carcere e teatro” (premio reportage Orvieto Prof. Photography Awards 2005),
“Go 4 it/Universiadi 2007”.
Ha curato l’immagine per vari personaggi dello spettacolo, Arturo Brachetti, Luciana Littizzetto, Fernanda Lessa, Antonella Elia, Neja, Eiffel65, Marco Berry, Levante …
Negli ultimi anni ha spostato la sua creatività anche alle riprese video, sia come regista che come direttore della fotografia, uno dei suoi lavori più premiati è il videoclip “Alfonso” della cantautrice Levante (oltre otto milioni di visualizzazioni).
Ha diretto il dipartimento di fotografia dello IED di Torino ed è docente di “Educazione al linguaggio fotografico” presso la RM Moda e design di Milano.
Paolo Ranzani è referente artistico 4k in merito al progetto “TORINO MOSAICO” del collettivo “DeadPhotoWorking”, progetto scelto per inaugurare “Luci d’Artista” a Torino.
E’ stato nominato da Giovanni Gastel presidente AFIP Torino.
Nel 2019 il lavoro fotografico sul teatro in carcere è stato ospite di Matera Capitale della Cultura.
Pubblicati e mostre:
“Ecce Femina” (2000),
“99 per Amnesty” (2003),
“La Soglia. Vita, carcere e teatro” (premio reportage Orvieto Prof. Photography Awards 2005),
“Go 4 you/Universiadi 2007” ,
Premio 2005 per il ciack award fotografo di scena
Premio 2007 fotografia creativa TAU VISUAL
Premio 2009 come miglior fotografo creativo editoriale
Ideatore e organizzatore del concorso fotografico internazionale OPEN PICS per il Salone del Libro di Torino – 2004
Dal 2017 scrive “Ap/Punti di vista” una rubrica bimestrale di fotografia sul magazine Torinerò.
No comment yet, add your voice below!