fbpx Skip to content

L’intelligenza artificiale in fotografia: cambierà i paradigmi della nostra vita e della creatività?

di Paolo Ranzani

Gli ultimi progressi nel campo della fotografia digitale sono avvenuti a una velocità supersonica che ormai ci sentiamo sempre più vicini alla famosa serie STAR TREK: ci mancano il teletrasporto e un paio di Vulcaniani e siamo a posto.

Le grandi aziende stanno finanziando da anni la ricerca nel settore per dotare i propri dispositivi smartphone di telecamere più potenti, chip all’avanguardia e sistemi di Intelligenza Artificiale sempre più sensibili.

Oramai è piuttosto inutile lamentarsi del fatto che anche un idiota possa creare immagini piacevoli, possiamo dire che sia obsoleto perdere tempo in imprecazioni contro la tecnologia che ha abbassato la qualità della fotografia. E’ vero ma non è neanche poi così vero. E’ un discorso complicato. La mutazione avviene dal giorno del BIG BANG nello spazio, ogni giorno fa invecchiare quello precedente, o ne prendiamo atto o resteremo ancorati al bitume di Giudea.

(n.d.r. Idrocarburo impiegato nella pratica delle incisioni a morsura delle matrici da stampa in quanto si altera alla luce solare e esposto ai raggi schiarisce in proporzione alla loro intensità. )

Siamo nell’era dell’intelligenza artificiale ed è necessario capire come questa nuova modalità possa essere utilizzata e sfruttata dal professionista e non osteggiata, sarebbe sciocco.

L’I.A è arrivata ad un livello di ottimizzazione delle fotografie superiore a qualunque aspettativa uno avesse avuto anche solo 10 anni fa, come ad esempio generare file in alta risoluzione per salvarli e ridurli tantissimo senza perdere qualità, questa cosa che ci sembra ovvia è già una possibilità donata dalle nuove tecnologie.  Da uno smartphone possiamo avere file in alta risolizione che occupino pochissima memoria ma per poi raggiungere ingrandimenti incredibili.

L’ultima frontiera, al momento, è quella di cui tutti parlano,ovvero la possibilità di generare incredibili immagini solamente descrivendo ciò che desideriamo vedere. Più siamo bravi e precisi nell’inserire i dati e più sarà straordinario il risultato. L’intelligenza Artificiale che genera immagini.

Per fare delle prove esercitatevi con Crayon, Dall-E 2, Midjourney, Dream, StarryAI, Imagen, Parti.

Sono programmi con I.A. addestrati per generare immagini da descrizioni di testo immesse dagli utenti. Si tratta di prodotti sempre più avanzati, in grado di creare disegni e grafiche degni di un professionista. La novità sta creando qualche preoccupazione nel mondo artistico, in particolare fra i creatori di immagini che si chiedono se presto saranno senza lavoro. Al momento solo Crayon è disponibile liberamente al grande pubblico, ma è difficile non chiedersi cosa accadrà una volta che i modelli con intelligenza artificiale saranno a tutti gli effetti lanciati nel mercato. Vedremo cose da far girare la testa.

In effetti i risultati lasciano esterrefatti. I paradigmi stanno davvero cambiando e dobbiamo accelerare le nostre sinapsi per capire come poter utlizzare questi elementi creativi senza farci schiavizzare dalla banalità del gesto.

Secondo Mar Hicks, professore presso l’Illinois Institute of Technology che studia la storia della tecnologia, questo sistema è tanto divertente quanto pericoloso. Craiyon, infatti, genera sempre un’immagine dalla descrizione, invece di filtrare alcune descrizioni mostrando un errore. Hicks è preoccupato per la capacità del sistema di intelligenza artificiale di rispondere a qualsiasi richiesta scritta. Ciò può alimentare alcuni stereotipi, poiché l’I.A. si basa su dati provenienti da internet, il che significa che le immagini che creano possono anche mettere a nudo una serie di pregiudizi tra cui genere, razza e stereotipi sociali.

Anche questi sono problemi da tenere presente per l’effetto domino che questa ennessima rivoluzione porterà.

Io ero già assolutamente stupefatto quando capii come funziona SIRI, e poi dal fatto che potevi dettare a voce e le parole si scrivevano da sole sul testo bianco del computer. Adesso resto basito quando uso il traduttore per parlare con amici ucraini, parliamo dentro ad un coso e ci capiamo. Ogni mese c’è un salto nell’iperspazio che si fa quasi fatica a reggere, almeno per gli over 50, mi spiego, anche se non siamo di quelli che prendono male ogni nuova innovazione tecnologica, ma al contrario ci piace essere sorpresi, è davvero faticoso prenderne atto, entrarci denro per capirne le potenzilaità e poi tradurle in possibilità creative, perché poi alle fine, diciamolo, per gli autori che adorano spaziare il più possibilie oltre ogni frontiera, la ricerca è sempre quella, quella che ci fa dire: “Ok, bella sta cosa, ma come la posso usare? Cosa ci posso produrre? Dove mi porterà ad immaginare? Quali confini rompe e quali limiti potrebbe avere?”

E oggi siamo di fronte a nuove domande di questo tipo, è diventato possibile far creare immagini ad una macchina semplicemente fornendole delle minime indicazioni testuali. Il passaggio da testo ad immagine è strabiliante ed è immediata la “magia” della creazione, da qui non ci si più non interrogare sull’origine della creatività, sul significato di arte e di autore. Io non sono minimamente interessato a come funzionanino queste tecnologie e non ne ho le competenze neanche per ascoltare chi le sa e prova a spiegarmele, però ho trovato dei testi che provano a sintetizzare il funzionamento, ve le copioicollo qui per chi avesse questa voglia e capacità.

Come funzionano i generatori di immagini.

I generatori di immagini sono basati su reti generative avversarie o GAN (Generative Adversarial Networks). Si tratta di architetture nelle quali due reti neurali si sfidano in una sorta di gioco a somma zero. La rete detta Generatore, partendo da numeri casuali, ha il compito di elaborare immagini realistiche, provando ad ingannare il Discriminatore. La rete Discriminatore viene addestrata a riconoscere immagini preesistenti, attraverso l’analisi di milioni di esempi etichettati appropriatamente, con l’obiettivo di capire se quelle prodotte dal Generatore sono reali o artificiali. Pian piano, di tentativo in tentativo, il Generatore impara a produrre immagini sintetiche che sembrano create da un umano.

I sistemi più evoluti di “text to image”, come quelli di OpenAI e Imagen di Google, usano dei “diffusion model”. Entrambi partono da un modello in grado di comprendere delle frasi complesse, non semplici parole chiave.
Nel sistema di OpenAI queste frasi vengono passate a dei calcolatori che usano un modello, detto “prior”, che ha il compito di generare “CLIP image embeddings” ossia di “farsi un’idea” di quelle parole (come succede a noi umani quando ci chiedono di disegnare una spiaggia con degli ombrelloni e delle barche all’orizzonte). Poi queste “CLIP image embeddings” vengono passate ad un’altra rete che, sulla base di un “Decoder Diffusion model” (unCLIP), inizia a disegnare quell’idea per passi successivi (vedi video in basso).
Anche Imagen di Google usa un “diffusion model”, mentre il nuovo Parti usa un “autoregressive model” per trasformare le parole in immagini con un codificatore di testo che attinge a 20 miliardi di parametri (dettagli tecnici).

Fonte: VINCOS BLOG

In questo momento i programmi di generazione di immagini più sofisticati sono in fase di sperimentazione. Prima di essere rilasciati a tutti, ne vanno studiati i rischi di utilizzo come la produzione di contenuti violenti o falsi che possono mettere in cattiva luce determinate persone o categorie e la generazione di output che possono riflettere i pregiudizi e gli stereotipi contenuti nei modelli linguistici di grandi dimensioni.

Prima o poi questi software diventeranno di dominio pubblico, si moltiplicheranno ed evolveranno e probabilmente entro cinque anni li vedremo applicati anche ai video.

C’è da aspettarsi che creeranno problemi alle agenzie di stock images, mi sembra ovvio, di certo resterà da capire la storia dei diritti d’autore: chi, cosa, come, a chi, e sarà una bella matassa da sciogliere!

Ad ogni modo, nonostante stiano già piovendo molte critiche, io resto convinto che questi strumenti basati sull’Intelligenza Artificiale non distruggeranno la creatività, ma al contrario potranno moltiplicare idee e gesti degli autori più curiosi e desiderosi di crescere senza confini.

Altri articoli di questo autore

Condividi

No comment yet, add your voice below!


Add a Comment

Vuoi accedere agli eventi riservati?

Abbonati a soli 15€ per 365 giorni e ottieni più di ciò che immagini!

Se invece sei già iscritto ed hai la password, accedi da qui

Dimmi chi sei e ti dirò che workshop fa per te

Non è facile trovare un buon educatore!
Appartengo ad una generazione che ha dovuto adattarsi alla scarsa offerta dei tempi. Ho avuto un solo tutor, a cui ancora oggi devo molto. Brevi, fugaci ma intensi incontri in cui il sottoscritto, da solo con lui, cercava di prendere nota anche dei respiri e trarre insegnamento da ogni singola parola.
A causa di questa carenza io e i miei coetanei ci siamo dovuti spesso costruire una visione complementare come autori, designers, critici ed insegnanti e questo ci ha aiutato a costruire qualcosa di fondamentale e duraturo.
Per questo motivo con Cine Sud che vanta un’esperienza di oltre 40 anni nel settore della formazione, abbiamo pensato alla possibilità di offrire dei corsi “one to one”, costruiti sulla base delle esigenze individuali e in campi disparati, che vanno dalla tecnica alla ricerca di nuovi linguaggi in fotografia.
Dei corsi molto vicini a quelli che avremmo voluto avere nel passato, se ce ne fosse stata offerta l’opportunità e la parola opportunità non va sottovalutata, perché ha un peso e una sua valenza e non è spesso scontata.
Ognuno sarà libero di scegliere, sulla base dei nostri consigli, un autore o un tecnico, tra quelli offerti come docenti, e intraprendere un corso che gli offra quello di cui realmente ha bisogno e, eventualmente, ripetere questa esperienza in futuro.
Come quando si va da un eccellente sarto a scegliere con cura un vestito, adattandolo perfettamente al corpo, vogliamo fornirvi il corso che meglio si adatta alle vostre, singole e personali esigenze.
Niente nasce dal caso e per poter essere all’altezza di questo compito e potervi fornire un’offerta diversificata e soddisfacente, abbiamo pensato di sottoporvi un questionario tra il serio e lo scherzoso a cui vi preghiamo di rispondere.
Aiutateci a capire le vostre reali esigenze e chi abbiamo difronte, non ve ne pentirete.
Massimo Mastrorillo

Dimmi chi sei e ti dirò che workshop fa per te

Approfondiamo ! per i più intrepidi
X