In occasione della IEEE/CVFComputer Vision and Pattern Recognition Conference tenutasi dal 18 al 22 giugno, Intel Labs ha presentato una nuova intelligenza artificiale generativa in grado di creare della immagini 3D e a 360° partendo da un semplice input di testo. Questa nuova tecnologia potrebbe dimostrarsi particolarmente utile nel campo della modellazione poligonale e quello della creazione di videogiochi.
LDM3D può creare incredibili immagini in 3D partendo da un semplice testo
Latent Diffusion Model for 3D (LDM3D) è un modello di diffusione, sviluppato da Intel in collaborazione con Blockade Labs, che utilizza l’intelligenza artificiale per generare una mappatura di profondità e creare immagini 3D a 360° partendo da un semplice input testuale. Con questa tecnologia, Intel vorrebbe rivoluzionare la creazione di contenuti per le esperienze digitali e il metaverso.
LDM3D è stato istruito con un dataset di 10.000 campioni del databate LAION-400M, che a sua volta contiene oltre 400 milioni di coppie immagine-didascalia. Il tutto è stato possibile grazie alla potenza dei processori Intel Xeon e gli acceleratori per AI Intel Habana Gaudi, che hanno alimentato il super computer in grado di creare esperienze immersive e viste a 360°.
Tuttavia, per Intel, questo è soltanto il primo passo: questo progetto, infatti, apre la strada ad ulteriori progressi nello sviluppo di intelligenze artificiali generative in grado di aumentare le capacità umane. LDM3D è disponibile anche in versione open source tramite HuggingFace, in modo che ricercatori e sviluppatori possano trarne beneficio ed adattarlo alle proprie applicazioni.
Avete già dato un’occhiata al nostro approfondimento sulle migliori AI per ogni esigenza? Lo trovatequi!