Modelli Disponibili e Guida alla Generazione di Immagini
In questo capitolo sono indicati i modelli utilizzabili per la generazione delle immagini tramite IA e vi sono delle istruzioni sulla scrittura dei prompt necessari a generare l'immagine che avete in mente. Partiamo innanzitutto con lo specificare che vi sono decine di modelli disponibili online, ognuno con i propri pregi e difetti, e ci concentreremo soprattutto su quelli che offrono uno spazio di generazione gratuito tramite la piattaforma huggingspace.co. Purtroppo sappiamo tutti come Wattpad tratta i link, impedendo di cliccarli per aprire la pagina, perciò i link presenti su questa pagina dovrete pazientemente ricopiarli su una nuova finestra del vostro browser (in caso voleste aprirli). La piattaforma huggingface offre delle generazioni gratuite, ma può richiedere la creazione di un account. Inoltre è piuttosto buggata in certi modelli e spesso si blocca o richiede tempi d'attesa lunghi (un paio di minuti). Tenetelo a mente
Modelli Gratuiti:
- Stable Diffusion 1.5 (che prediligiamo): https://huggingface.co/runwayml/stable-diffusion-v1-5
La versione 1.5 di Stable Diffusion è ottima per quasi tutti i tipi di generazioni. Spicca particolarmente per la creatività e i migliori risultati si ottengono inserendo nel prompt la richiesta di imitare un artista in particolare (o più artisti insieme). Per esempi di prompt impressionanti, consigliamo di entrare nel server Discord di Stable Diffusion per dare un'occhiata ai complicatissimi input testuali che alcuni utenti utilizzano in modo da generare immagini molto elaborate, o di dare un'occhiata al sito prompthero.com
- Stable Diffusion 2.1: https://huggingface.co/spaces/stabilityai/stable-diffusion
A mio parere inferiore rispetto alla versione precedente, ma se la cava meglio nel fotorealismo e nella coerenza dei prompt grazie alla CLIP-guidance, è possibile generare ottime immagini, ma i prompt devono essere più complicati rispetto alla versione 1.5
- Openjourney: https://huggingface.co/prompthero/openjourney
Modello ottimo, specialmente per generare arte un po' complessa. Se la cava bene coi personaggi, a differenza di Stable Diffusion, ma le immagini tendenzialmente hanno un po' più di distorsioni e artefatti. Tuttavia è una scelta eccellente ed è velocissimo, nonostante il normale Midjourney a pagamento (in particolare la versione 4.0) è infinitamente più impressionante. Ha un po' di problemi coi tempi di loading però
- Nightcafe: https://creator.nightcafe.studio
Modello decisamente inferiore ai precedenti ma molto semplice da usare. Non rispetta molto i prompt, ma le immagini sono spesso cinematiche e d'effetto. Ci sono alternative migliori però
- Artbreeder: https://artbreeder.com
Modello ormai piuttosto vecchio che permette di fare dei collage di immagini e trasformarli in seguito tramite il text-2-image. Può generare immagini molto suggestive, ma tendenzialmente piene di artefatti e distorsioni
- Altri modelli dalla piattaforma huggingface: https://huggingface.co/models?pipeline_tag=text-to-image
Scorrendo la lista qui presente, sono disponibili parecchi modelli incentrati su stili più definiti e particolari. Ad esempio vi sono modelli incentrati sull'animazione disney, alcuni sullo stile dei manga giapponesi, alcuni incentrati sullo stile di Van Gogh... non è detto che questi modelli vi lascino generare immagini a tempo indeterminato, tuttavia. Spesso hanno un limite di utilizzo che vi chiederà di creare un account. Li potete trovare anche qui, se l'environment è acceso: https://huggingface.co/spaces/anzorq/finetuned_diffusion
Modelli a Pagamento:
- Dall-E 2: https://openai.com/dall-e-2
Il primo modello text-2-image. Ormai è obsoleto vista la forza delle alternative sul mercato, pieno di artefatti, ma se la cava molto bene con il fotorealismo, i personaggi e le concept art semplici. Non richiede prompt eccessivamente complessi e creando l'account si hanno 50 generazioni gratuite prima di dover acquistare crediti
- Midjourney: https://midjourney.com
A nostro avviso il modello più complesso e impressionante, richiede grande abilità nella costruzione di prompt testuali ma può generare immagini molto realistiche. Costa parecchio (30€ al mese), ma è il migliore semmai decideste di investirci molto tempo. Lascia generare una ventina di immagini come prova prima di chiedere l'abbonamento. Richiede la creazione di un account Discord
- Dreamstudio: https://beta.dreamstudio.ai
Uno spazio per girare Stable Diffusion con qualche opzione in più e in maniera illimitata e rapida. Anche questo richiede la creazione di un account Discord e permette la generazione di qualche centinaio di immagini gratuitamente prima di chiedere l'abbonamento
- NovelAI: https://novelai.net
NovelAI presenta dei modelli molto particolari basati su Stable Diffusion. Può generare character art molto impressionante ma l'abbonamento ha delle limitazioni per quanto riguarda la generazione di immagini
I modelli che abbiamo citato sono solo i più famosi e caratteristici nell'ambiente della generazione di immagini, e sono disponibili decine di alternative reperibili con una semplice ricerca su Google (attenzione a non venire fregati da certi abbonamenti, però!). Ora è tempo di iniziare a spiegare il funzionamento dei prompt testuali. Vi sono infatti molti modi di comunicare al modello l'idea dell'immagine che si vuole generare: dalla semplice frase (strettamente in inglese) che descrive la scena da riprodurre al complesso prompt arricchito di decine di modifier che cercano di elevare la qualità dell'immagine e definire uno stile particolare. Esempi di questi modifier, comuni a tutti i modelli, possono essere parole come "detailed", "digital art", "highly detailed", "detailed background", "trending on Artstation", "landscape art"... Questi elementi fanno una gran differenza nell'immagine finale, mettendo a freno la caotica creatività del modello per ricordargli che il risultato dev'essere realistico e credibile. In questo modo si evitano personaggi con nove dita in ogni mano o tre occhi in faccia. Altri modifier stilistici invece possono indicare al modello uno stile da adottare (es. "watercolor painting", "in the style of Van Gogh", "renaissance portrait", "surrealism", "steampunk"), e un modo interessante di ottenere stili unici è quello di combinare gli stili di artisti differenti. Per esempi di prompt efficaci e complessi vi consigliamo di entrare nel server di StableDiffusion o di Midjourney e dare un'occhiata ai tipi di input testuale usati dagli utenti per generare le proprie immagini. Tuttavia, consigliamo anche di sperimentare con i prompt. Ricordate anche che il corredo di immagini generate e la loro qualità non influirà particolarmente sul giudizio finale, dato che è facile prendere semplicemente un prompt molto complicato in cui ci si è imbattuti e generare immagini molto cinematiche e impressionanti senza fatica. Il principale protagonista sarà sempre il racconto breve e la vostra capacità di avvolgere i giudici con un'estetica efficace e ben espressa anche dalle immagini generate. Detto questo, se ci sono altre domande saremo ben lieti di rispondere ad ogni dubbio o curiosità in merito all'utilizzo dei modelli text-2-img e alla generazione di immagini tramite IA
Bạn đang đọc truyện trên: Truyen247.Pro