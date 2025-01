DeepSeek ha travolto come un tsunami il mondo dell’intelligenza artificiale e dopo aver fatto a pezzi ChatGPT, sembra essere pronta a battere anche i modelli di generazione delle immagini come DALL-E 3 e Stable Diffusion. In queste ore, infatti, la compagnia cinese ha ufficialmente presentato Janus-Pro: un nuovo modello AI che può analizzare e creare immagini in modo molto preciso.

DeepSeek Janus-Pro: una vera alternativa a DALL-E 3 e Stable Diffusion

Crediti: DeepSeek

DeepSeek Janus-Pro è un nuovo framework autoregressivo che unifica la comprensione e la generazione multimodale, disaccoppiando la codifica visiva in percorsi separati, pur utilizzando un’unica architettura di trasformatore unificata per l’elaborazione. Questo nuovo modello è basato su DeepSeek-LLM-1.5b e DeepSeek-LLM-7b-base, mentre per la comprensione delle immagini utilizza

SigLIP-L come codificatore visivo, che supporta l’input di immagini in formato 384 x 384 pixel.

Anche in questo caso, come per il modello R1, Janus-Pro viene fornito con licenza MIT e di conseguenza può essere utilizzato senza restrizioni anche a scopi commerciali. Attualmente il modello può essere utilizzato su Hugging-Face, mentre non è ancora disponibile un sito web ufficiale o un’app per la generazione diretta delle immagini.

