Immagini reali o “artificiali” ?

Avrete notato che negli ultimi tempi sulla rete girano immagini di ogni genere, generate dai software di intelligenza artificiale (“AI”). Ce ne sono tantissime, dalle più grezze a quelle davvero bellissime, generate su nostra richiesta da questi software. E’ la nuova frontiera delle immagini digitali, e costituisce uno degli utilizzi oggi più diffusi di questi software di nuova generazione, cosiddetti “generativi“, come Chat-GPT, per intenderci.

Solo un cenno, davvero rapido, su come funzionano questi strumenti. Hanno sostanzialmente due componenti principali: un enorme Data Base, con tutto quanto hanno raccolto sulla rete, che serve come “base di conoscenza”, per ricercare testi o immagini analoghe prodotte in precedenza. Questo pone anche una serie di problemi: sulle autorizzazioni, il Copyright, la veridicità delle informazioni raccolte con questa “pesca a strascico”, eccetera. Non a caso si stanno elaborando delle regole, a livello internazionale, ed anche l’Unione Europea ha prodotto un AI-Act, per gestire questa e molte altre criticità poste dall’utilizzo di questi prodotti, come la certificazione delle fonti e la riconoscibilità di quanto prodotto dalle AI.

[NOTA al novembre 2025: Devo correggere un errore di superficialità nella frase precedente. Questi modelli neurali generativi non hanno un “enorme Data Base“, perchè la loro conoscenza è stata accumulata in fase di addestramento, fatto su enormi dataset, costituiti da ogni genere di informazione. La “conoscenza” è accumulata nei layer della rete neurale, tramite miliardi di parametri che “pesano” i dati di input, livello dopo livello (layer), fino a generare la risposta finale. Nei modelli più avanzati, come GPT-5, i layer sono centinaia, e centinaia di miliardi sono i parametri (stime effettuate, i dati non sono stati resi pubblici da OpenAI). La conoscenza è poi rinforzata dall’accesso alla rete, quando non si riesce a formulare una risposta adeguata, o quando è necessario aggiornare le informazioni con dati recenti, o su richiesta dell’utente. Aggiungo solo che il modello basato su “Basi di Conoscenza” e regole precostituite, era il paradigma in uso per la “Old Fashion AI” dei bei tempi andati, che diedero origine ai Sistemi Esperti, mentre le Reti Neurali hanno completamente rivoluzionato il settore, dando poi vita agli attuali modelli generativi co oggi utilizziamo tutti. Un aggiornamento ulteriore riguarda l’entrata in vigore dell’AI Act, che sta entrando gradualmente nella sua fase attuativa]

(Immagine generata dal Copilot Microsoft)

L’altra componente principale è basata sul Machine Learning, la capacità di “imparare”, con una lunga fase di “addestramento”, e di produrre risultati in modo autonomo, generando quindi cose nuove, in modo autonomo dal contributo umano. Ma la “generazione” avviene a partire dalle richieste che noi facciamo loro, dalla precisione e dalla mancanza di ambiguità di queste nostre richieste. Si pone quindi il problema di imparare a definire bene le richieste, a come produrre cioè i cosiddetti “patterns” più adatti. E da qui stanno nascendo nuove professioni e nuove competenze, che dovremo acquisire man mano, per usare al meglio le AI Generative.

(Immagine generata dal Copilot Microsoft)

Detto questo, come introduzione, si pone un problema enorme, quasi storico, che riguarda l’identificazione dell’origine di questi prodotti: testi, immagini, e ora anche filmati. L’AI-Act impone di dichiarare le fonti, ma da qui a vedere applicata questa regola, ce ne passerà di tempo… Anche perchè l’AI-Act, seppure già approvato dal Parlamento Europeo, ancora non è arrivato alla fase attuativa. E poi, pensiamo alla proliferazione a livello internazionale di questo tipo di prodotti: testi, immagini, filmati. Così come si assiste, da sempre, al fenomeno della contraffazione, anche per i beni fisici, figuriamoci poi per questi digitali. Ma la tecnologia ci viene in soccorso: una soluzione efficace sarebbe quella di creare degli NFT sulla Blockchain, anche se l’utilizzo di questi strumenti ancora non è molto diffuso, e trova tanti ostacoli e molti denigratori in giro per il web, a causa delle truffe in Cryptovaluta e delle speculazioni esagerate a cui abbiamo assistito ultimamente. Ne abbiamo parlato già in passato su questo Magazine, quella della Blockchain è una tecnologia ancora giovane ed immatura. E allora, nel frattempo, cosa facciamo? Come si fa a stabilire se l’immagine di sua Santità Francesco in piumino fosse vera, o prodotta da una AI (era falsa naturalmente, prodotta da una AI) ?

(Immagine generata da una AI, dalla rete)

Per pura curiosità, non perchè sia di facile utilizzo, vi voglio indicare il possibile uso della “Steganografia“. Termine oscuro, per il 99% degli individui, me ne rendo conto, ma proviamo a spiegarlo in due parole: la steganografia è la tecnica di nascondere delle informazioni all’interno di oggetti digitali di vario tipo: musica, immagini, ecc. Parliamo delle immagini, per rendere molto semplice la comprensione. Sappiamo tutti che una immagine digitale è composta da tanti “pixels”, microscopici quadratini, ognuno con il proprio livello di RGB: Red (rosso), Green (verde) e Blue. Per ognuno di questi tre colori fondamentali c’è una diversa intensità, indicata con un numero da 1 a 255. Quindi, se diciamo che quel pixel ha un RGB di 000:025:122, stiamo indicando l’intensità di ognuno dei tre colori fondamentali, che, mescolati insieme, danno il colore specifico di quel singolo “pixel”. Tutti i pixel insieme ci danno l’immagine, e quello che varia da una immagine all’altra è la “definizione”, e cioè quanti pixel compongono una immagine. Più pixels ci sono nell’immagine, più l’immagine è ben definita. Una immagine di 1920×1080 pixels, è meno definita di una con 384×2160 pixel, e più diminuisce il numero di pixel componenti l’immagine, più l’immagine si “sgrana”. Perdonate questa digressione tecnica, e torniamo alla Steganografia.

(Immagine generata dal Copilot Microsoft)

In una immagine tipo possiamo avere, ad esempio, 1920×1080 pixels (larghezza x altezza), questo vuol dire 2.073.600 di pixels, ognuno con la sua gradazione di colore, data dal suo RGB: un’enormità di informazioni, ma per fortuna ci pensa il software di gestione immagini a gestirla, e la scheda grafica ad interpretarla. Ora, se di questi milioni di pixels noi ne sfruttassimo alcuni (o anche tanti..!) per nascondere un messaggio, l’immagine non cambierebbe assolutamente per la nostra percezione, perchè molti pixels sono ininfluenti, non levano e non mettono nulla all’immagine nel suo complesso. Se ne sfruttiamo una parte per inserirci dei dati, “nascosti” per contenere un messaggio, ad esempio, per la percezione dell’occhio umano non cambia assolutamente nulla! E quello che abbiamo detto per i pixels delle immagini vale anche per i messaggi sonori, composti da una moltitudine di frequenze diverse, alcune neanche percepibili dall’orecchio umano.

E’ la tecnica utilizzata per mandare messaggi nascosti, spesso usata dalle spie o da soggetti malevoli, o anche per usi legittimi ma riservati, per passare informazioni. Questa è la “Steganografia“, in pillole. E questa tecnica potrebbe anche essere utilizzata per inserire una “firma“, un marchio che ne attesti l’origine e la proprietà. Una tecnica divertente e curiosa, e di non facile utilizzo (tranquilli, ci sono prodotti software che fanno questo, come OpenPuff, ad esempio). Naturalmente, questa tecnica è oggi ampiamente superata, sia dagli NFT sulla Blockchain che dalla Firma Digitale con chiave asimmetrica, chiave privata per firmare, e decodificabile unicamente con la chiave pubblica di un soggetto, in modo da attestarne l’autenticità. E’ la moderna “Crittografia a chiave Asimmetrica” (che differisce da quella a chiave simmetrica, che utilizza la stessa chiave sia per la codifica che per la decodifica).

Ma a volte, le vecchie tecniche dei nonni risultano più divertenti da usare, e la Steganografia è una di quelle. Per quanto mi riguarda, sono un sostenitore degli NFT su Blockchain, una tecnologia davvero geniale, ma nella vita occorre anche divertirsi..!

Un saluto.

(Nota: l’immagine in evidenza è generata dal Copilot Microsoft)

VIRTUAL WORLDS MAGAZINE

Our future is in the real and virtual worlds

Mi piace:

RispondiAnnulla risposta

Follow VIRTUAL WORLDS MAGAZINE

Condividi:

Mi piace:

RispondiAnnulla risposta

Follow VIRTUAL WORLDS MAGAZINE