Se c’è qualcosa che abbiamo imparato avendo a che fare con l’intelligenza artificiale, è che il principale vantaggio di queste tecnologie è svolgere in pochi secondi mansioni che a noi richiederebbero ore. Lo abbiamo visto con ChatGPT e Bing, che possono darci risposte che i vari Google Assistant, Siri e Alexa si sognano, e più in generale con le varie IA generative come Midjourney e Synthesia, in grado di creare immagini e video con una qualità tale da mettere a rischio migliaia di posti di lavoro. Ma un aspetto che non è ancora stato esploso e che aspetta di farlo è quello delle IA modificative, se così vogliamo chiamarle, e l’eco mediatica che sta avendo il progetto Drag Your GAN ne è la dimostrazione.
L’intelligenza artificiale prende il posto di Photoshop: l’immagine si stravolge in pochi click
Se avete mai avuto a che fare con Photoshop (o software analoghi), saprete bene che per effettuare determinate modifiche ci vuole molto tempo e maestria per farlo con efficacia. Ma quello che riesce a fare Drag Your GAN è superare questo limite, rendendo ancora più democratica la manipolazione delle immagini. Più di tante parole, il video qua sopra è decisamente esplicativo: basta trascinare l’immagine per modificarla realisticamente, per esempio muovendo una palpebra o le labbra per cambiare l’espressione del volto, muovendo braccia e gambe per far cambiare postura alla persona o all’animale fotografato, o ancora spostare un oggetto per modificarne la prospettiva tridimensionale. Sembra semplice, ma non lo è affatto: modifiche del genere sarebbero complesse se non impossibili da effettuare manualmente, specialmente con questo grado di fedeltà visiva.
Per quanto software come lo stesso Photoshop o piattaforme come Midjourney, DALL-E o Stable Diffusion permettano modifiche similari, non si era mai vista una flessibilità del genere, il ché apre le porte a scenari considerevoli. Immagino per esempio un fotografo che effettua una sessione di scatto con una modella e che in fase di post-editing può liberamente cambiare posa ed espressione senza dover mangiarsi le mani per non averlo fatto in fase di scatto. La sua utilità si collega anche alla generazione IA delle immagini: se chiedo a Midjourney la foto di una persona che guarda un tramonto, potrei volerne cambiare l’altezza o l’orientamento, ma è soltanto uno dei milioni di esempi che si potrebbero fare.
Freniamo gli entusiasmi, però, perché Drag Your GAN è il frutto della ricerca del Max Planck Institute for Informatics in collaborazione con Google, la presentazione avverrà al SIGGRAPH 2023 ma potrebbe volerci ancora tempo prima che diventi un effettivo software per il pubblico.
⭐️ Scopri le migliori offerte online grazie al nostro canale Telegram esclusivo.