La creazione manuale di prompt per immagini è morta: Ingegnerizza al contrario immagini in stile Midjourney con PromptPerfect

Ehi tu! Sì, proprio tu che stai leggendo. Il prompt engineer che passa fin troppo tempo su Midjourney e altri modelli di generazione di immagini. Questo post è proprio per te.

'Non avrei mai pensato che l'AI mi avrebbe mangiato la faccia,' singhiozza la donna che ha votato per il Partito dell'AI che Mangia le Facce delle Persone.

💡

Con le scuse a Adrian Bott

Con l'AI che divora sempre più lavori, potremmo anche dire:

Prima l'AI è venuta per gli artisti, e io non ho parlato – perché non ero un artista. Poi è venuta per i prompt engineer (che avevano usato l'AI per spazzare via gli artisti), e mi sono ritrovato nei guai perché quello era il mio lavoro.

💡

Con le scuse a Martin Niemöller

Proprio così, amico. Sei tu che metti il "mid" in Midjourney. La tua Stable Diffusion è più una confusione instabile. E le tue capacità con DALL-E sono in realtà SCAR-SE. Con strumenti come PromptPerfect chiunque può semplicemente fare reverse engineering delle immagini esistenti per generare prompt, o generare prompt con feedback in tempo reale e passo dopo passo da un essere umano nel processo.

Quindi, vediamo come puoi fare reverse engineering dei prompt dalle immagini, così da rimanere un passo avanti ai leopardi dell'AI che vogliono mangiare la tua faccia... almeno per ora.

💡

PromptPerfect non supporta solo immagini in stile Midjourney - puoi anche generare prompt migliori personalizzati per DALL-E 3 e Stable Diffusion XL, così come per molti LLM.

tagPromptPerfect Interactive

PromptPerfect Interactive trasforma il modo in cui generi contenuti e affronti compiti complessi. È costruito su un approccio duplice:

Assistente Dedicato: Un compagno AI che comprende le tue esigenze e ti aiuta a creare prompt efficaci, rendendo il processo di generazione dei contenuti il più fluido possibile.
Ottimizzatore Potente: Uno strumento avanzato che perfeziona i tuoi prompt per risultati ottimali, assicurando che i tuoi sforzi creativi e produttivi siano più efficaci che mai.

PromptPerfect ha recentemente introdotto la generazione di immagini in stile Midjourney, quindi in questo post useremo l'assistente e l'ottimizzatore di Interactive per fare reverse engineering dei prompt dalle immagini e poi generare nuove immagini basate su quei prompt nello stile di Midjourney.

tagCome Fare Reverse Engineering dei Prompt delle Immagini

Prima di tutto, abbiamo bisogno di un'immagine su cui lavorare. Usiamo questa immagine di Einstein punk che ho generato precedentemente in Midjourney:

Rendizione artistica di Albert Einstein in stile punk con capelli colorati ed elementi stilistici su uno sfondo sfocato e vibrante

Per generare l'immagine ho usato questo prompt in Midjourney:

Realistic photo of Albert Einstein as a punk, retaining his recognizable facial
features, with a brightly colored mohawk, visible tattoos, facial piercings,
and wearing a spiked leather jacket, highly detailed, photorealistic, vibrant
colors, dramatic lighting --ar 4:5 --s 500 --v 6

Ho poi caricato l'immagine nell'Assistente Interattivo di PromptPerfect e gli ho chiesto di generare un prompt basato su quell'immagine:

Screenshot di un articolo sull'ottimizzatore AI con una funzione prompt, inclusa un'immagine vibrante di Einstein e opzioni di stile.

Il prompt restituito è stato:

Colorful punk hairstyle, vibrant pink, orange, and gray hair, edgy jacket with
spikes and colorful geometric patterns, urban background, bokeh lighting,
cyberpunk aesthetic --ar 4:5 --v 6 --s 500

Bello... ma manca una cosa: il vecchio Albert stesso. Dato che Interactive ha un'interfaccia basata sulla chat, gli ho semplicemente detto di aggiungerlo al prompt:

Screenshot di una bozza di email con una rappresentazione creativa di Albert Einstein con istruzioni di Alex Cureton-Griffiths.

Ho quindi ottenuto:

Albert Einstein with a colorful punk hairstyle in vibrant pink, orange, and
gray hues, wearing an edgy jacket adorned with spikes and colorful geometric
patterns, set against an urban background with bokeh lighting, cyberpunk
aesthetic --ar 4:5 --v 6 --stylize 500

Noterai che non è esattamente lo stesso prompt che ho usato per creare l'immagine iniziale. Questo è perfettamente normale - in primo luogo perché le immagini generate dall'AI incorporano caratteristiche oltre il prompt usato per crearle. Per esempio, nell'immagine iniziale, Einstein guarda a destra e ha una macchia rossa sul risvolto - non ho specificato questi dettagli nel prompt, quindi se fai reverse engineering di un prompt dall'immagine, non otterrai semplicemente lo stesso prompt con cui hai iniziato. La seconda ragione è che il modello di analisi dell'immagine (come molta AI) è non deterministico -- puoi chiedere una seconda volta di fare reverse engineering di un prompt dalla stessa immagine e potrebbe cogliere dettagli diversi.

Comunque, ora che abbiamo un prompt, possiamo cliccare il pulsante "send to Assistant" per generare quattro immagini in stile Midjourney:

Interfaccia di generazione di testo con un prompt per un Albert Einstein stilizzato e un pulsante 'Send to Assistant'.

Una rappresentazione vibrante di Albert Einstein con un'acconciatura punk rosa, arancione e grigia, che indossa una giacca con borchie su uno sfondo bokeh

Ancora una volta, puoi vedere che non corrisponde all'immagine iniziale, e non lo farà mai. Prova semplicemente a inserire lo stesso prompt in un modello di generazione di immagini una seconda volta e otterrai risultati completamente diversi - come il modello di riconoscimento delle immagini è non deterministico.

Mi piace molto l'immagine in alto a sinistra. Cliccandola posso scegliere di ingrandirla, ed ecco la mia immagine finale dello zio fisico preferito da tutti con i capelli pazzi:

Ritratto colorato di Albert Einstein con capelli grigi, baffi, naso piercing e giacca con borchie su uno sfondo bokeh vivido

Naturalmente, puoi anche testare il prompt in Midjourney vero e proprio, e otterrai risultati simili:

Collage di quattro ritratti vivaci di Albert Einstein in abiti vivaci e vari colori di capelli, ambientati su scenari urbani espressivi

tagAltri Esempi

Ecco alcuni altri esempi. L'ordine del contenuto è:

Prompt iniziale
Immagine generata su Midjourney
Prompt ricostruito
Immagine in stile Midjourney generata su PromptPerfect Interactive

tagPiccione Turbo

abstract, minimalist mesh wireframe of A pigeon::4 , wearing a helmet and
carrying a turbo booster on its back, with a gradient of green, cyan, and blue
lines against a black background, Vanishing point, with minimal detailing::4 ,
--ar 16:9 --s 750 --v 6.0

Uccello futuristico con caratteristiche al neon rosa, blu e rosso su sfondo nero, che crea un'atmosfera tecno-artistica.

Futuristic bird with neon lights, intricate feather details, glowing pink and
blue colors, highly detailed, digital art, ethereal and luminous, dark
background, dynamic light streaks, cybernetic effect, hyper-realistic --ar
16:9 --v 6 --stylize 750

Arte digitale di un uccello mistico rosso e blu con luci colorate e scintille su uno sfondo sfumato.

tagCervello che si Scioglie

melting brain, floating in space, plain black background --ar 16:9 --niji 6
--s 750

Arte digitale colorata di un cervello che si scioglie in rosa e blu, con motivi simili a vene e bolle fluttuanti su sfondo scuro

Surreal, melting brain suspended in space, dripping neon pink and blue colors,
abstract, fluid textures, hyper-detailed, futuristic, digital art, cosmic
background with stars, vibrant and glowing, soft lighting --ar 16:9 --v 6
--stylize 750

Rappresentazione astratta di un cervello luminoso in tonalità rosa su uno sfondo scuro e stellato, che evoca un'aura mistica.

tagPrincipessa Leia di Bollywood

Bollywood Star Wars scene, close up shot of Princess Leia Organa in traditional
Indian attire, intricate jewelry, holding a defender sporting blaster pistol,
vibrant colors, futuristic elements, sci-fi, dramatic lighting, detailed
background, cinematic, 8K resolution, Unreal Engine, --ar 4:5 --v 6.0

Donna che interpreta la Principessa Leia con un blaster, capelli acconciati in chignon, in una stanza con toni rossi e lanterne appese.

Princess Leia, holding a blaster, futuristic sci-fi setting, white robe,
detailed hair buns, dramatic lighting, heroic pose, vibrant colors, cinematic
scene, intricate background with glowing elements --ar 4:5 --s 500 --v 6

Dipinto digitale di una donna in stile Principessa Leia in bianco, con un blaster, su uno sfondo bokeh colorato.

Hmm... devo dire che mi manca davvero l'aspetto Bollywood. Questo è un fatto della reverse engineering - a volte l'algoritmo di analisi delle immagini non vede qualcosa che un umano vedrebbe. Dopo un po' di aggiustamenti (un termine tecnico altamente specializzato nel prompt engineering), ho raffinato il prompt così:

Princess Leia, holding a blaster, futuristic sci-fi setting, dressed in a 
white robe with intricate Indian embroidery, ethnically Indian with 
traditional Indian facial features, detailed hair buns adorned with 
traditional Indian jewelry, dramatic lighting, heroic pose, vibrant colors, 
Bollywood-inspired design, charismatic expression, cinematic scene, intricate 
background with glowing elements and traditional Indian patterns --ar 4:5 --s 
500 --v 6

Che mi ha dato questa immagine:

Donna in abiti indiani con capelli intrecciati e gioielli che impugna una pistola, su uno sfondo luminoso.

Questo è dove l'ottimizzatore interattivo brilla davvero. Se fossi stato solo io, avrei semplicemente aggiunto il termine bollywood al prompt. Ma chiedendo all'ottimizzatore di Refine this Midjourney-style prompt to include more Bollywood vibes PromptPerfect ha aggiunto più parole descrittive al prompt (traditional Indian patterns, ecc.). Aggiungere più parole e dettagli che suggeriscono un risultato specifico è solitamente un modo molto migliore per influenzare l'immagine generata rispetto al modificare pesi e stili.

tagMedaglia Pastello

a medal is sitting on a podium against pastel colored confetti, in the style
of simplified forms and shapes, yellow and beige, columns and totems, playful
streamlined forms, nerdcore, contest winner, repetition and pattern --ar 64:39
--s 750 --v 6.0

Immagine celebrativa con una medaglia di bronzo con nastro rosso e motivo a corona d'alloro su uno sfondo blu intenso.

Award medal, intricate laurel design, suspended from a ribbon, celebratory
background, vibrant confetti, glowing lights, high detail, 3D render, soft
lighting, pink and blue color scheme, festive atmosphere --ar 16:9 --s 500
--v 6 --stylize 750

Medaglia misteriosa con bordi argentati, sospesa tra particelle rosse su uno sfondo blu profondo sfocato con cuori e stelle

tagInizia il Reverse Engineering delle Immagini

Per iniziare a utilizzare PromptPerfect per il reverse engineering dei prompt delle immagini, registrati e prova un piano a pagamento di PromptPerfect gratuitamente per sette giorni. E abbonati a un piano entro 24 ore dal tuo primo accesso per ottenere uno sconto del 40%:

Sai che è l'unico modo per rimanere un passo avanti a quei leopardi AI affamati!