DALL-E

algoritmo di IA capace di generare immagini a partire da descrizioni testuali

DALL-E, nella forma stilizzata DALL·E, è un algoritmo di intelligenza artificiale capace di generare immagini a partire da descrizioni testuali. Sviluppato da OpenAI, viene presentato il 5 gennaio 2021[1].

DALL-E
DALL-EWikipediaLogo.png
Immagine generata con l'intelligenza artificiale di DALL-E, raffigurando il logo di Wikipedia.
ClasseTransformer

SviluppoModifica

A seguito della pubblicazione dei modelli NLP GPT e GPT-2[2], OpenAI decide di applicare l'architettura dei transformer alla generazione delle immagini. A tal proposito, nel giugno 2020 pubblica ImageGPT, il quale utilizzando lo stesso codice di GPT-2 produce immagini coerenti[3].

Il 5 gennaio 2021, OpenAI presenta sul suo blog il modello DALL-E, capace di generare immagini a partire da una didascalia che l'utente inserisce. DALL-E mostra di comprendere fedelmente le istruzioni della descrizione testuale rendendosi capace di apprendere concetti spaziali e temporali.

Malgrado le capacità di DALL-E siano state ampiamente mostrate nel blog di OpenAI e nelle relative pubblicazioni, il codice del modello non è mai stato rilasciato interamente, fatto che ha favorito il rilascio di numerosi modelli testo-immagine: Cogview, DALL-E Mini, ruDALL-E[4][5].

CaratteristicheModifica

DALL-E produce immagini in risoluzione massima di 1024 x 1024 pixel[6] a partire da un testo in linguaggio naturale (è supportata la lingua inglese). DALL-E è capace di generare immagini e fotografie adeguandosi a vari stili come ad esempio la pixel art, lo stile cartoon, il rendering 3d. È anche capace di produrre immagini foto realistiche.

DALL-E, dopo un primo periodo di accesso solo tramite invito, è adesso aperto a tutti e offre 50 crediti all'iscrizione e 15 crediti al mese per la generazione delle immagini. Con ogni credito è possibile generare 4 immagini.

È anche possibile chiedere a DALL-E di produrre immagini, al posto che partendo da un testo, fornendo un'immagine. DALL-E in tal caso produrrà immagini visivamente simili ispirate all'immagine di partenza.

NoteModifica

  1. ^ DALL-E Creating Images from Text, su OpenAI Blog.
  2. ^ GPT-2: 1.5B Release, su OpenAI Blog.
  3. ^ Image GPT, su OpenAI Blog.
  4. ^ DALL-E Mini, su wandb.ai.
  5. ^ ruDALL-E, su rudalle.ru.
  6. ^ DALL-E: L'intelligenza artificiale crea immagini e foto da un testo, su net-parade.it.

Voci correlateModifica

Altri progettiModifica

Collegamenti esterniModifica

  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica