Ehi tu! Sì, proprio tu che stai leggendo. Il prompt engineer che passa fin troppo tempo su Midjourney e altri modelli di generazione di immagini. Questo post è proprio per te.
'Non avrei mai pensato che l'AImi avrebbe mangiato la faccia,' singhiozza la donna che ha votato per il Partito dell'AIche Mangia le Facce delle Persone.
Con l'AI che divora sempre più lavori, potremmo anche dire:
Prima l'AI è venuta per gli artisti, e io non ho parlato – perché non ero un artista. Poi è venuta per i prompt engineer (che avevano usato l'AI per spazzare via gli artisti), e mi sono ritrovato nei guai perché quello era il mio lavoro.
Proprio così, amico. Sei tu che metti il "mid" in Midjourney. La tua Stable Diffusion è più una confusione instabile. E le tue capacità con DALL-E sono in realtà SCAR-SE. Con strumenti come PromptPerfect chiunque può semplicemente fare reverse engineering delle immagini esistenti per generare prompt, o generare prompt con feedback in tempo reale e passo dopo passo da un essere umano nel processo.
Quindi, vediamo come puoi fare reverse engineering dei prompt dalle immagini, così da rimanere un passo avanti ai leopardi dell'AI che vogliono mangiare la tua faccia... almeno per ora.
tagPromptPerfect Interactive
PromptPerfect Interactive trasforma il modo in cui generi contenuti e affronti compiti complessi. È costruito su un approccio duplice:
- Assistente Dedicato: Un compagno AI che comprende le tue esigenze e ti aiuta a creare prompt efficaci, rendendo il processo di generazione dei contenuti il più fluido possibile.
- Ottimizzatore Potente: Uno strumento avanzato che perfeziona i tuoi prompt per risultati ottimali, assicurando che i tuoi sforzi creativi e produttivi siano più efficaci che mai.
PromptPerfect ha recentemente introdotto la generazione di immagini in stile Midjourney, quindi in questo post useremo l'assistente e l'ottimizzatore di Interactive per fare reverse engineering dei prompt dalle immagini e poi generare nuove immagini basate su quei prompt nello stile di Midjourney.
tagCome Fare Reverse Engineering dei Prompt delle Immagini
Prima di tutto, abbiamo bisogno di un'immagine su cui lavorare. Usiamo questa immagine di Einstein punk che ho generato precedentemente in Midjourney:

Per generare l'immagine ho usato questo prompt in Midjourney:
Realistic photo of Albert Einstein as a punk, retaining his recognizable facial
features, with a brightly colored mohawk, visible tattoos, facial piercings,
and wearing a spiked leather jacket, highly detailed, photorealistic, vibrant
colors, dramatic lighting --ar 4:5 --s 500 --v 6
Ho poi caricato l'immagine nell'Assistente Interattivo di PromptPerfect e gli ho chiesto di generare un prompt basato su quell'immagine:

Il prompt restituito è stato:
Colorful punk hairstyle, vibrant pink, orange, and gray hair, edgy jacket with
spikes and colorful geometric patterns, urban background, bokeh lighting,
cyberpunk aesthetic --ar 4:5 --v 6 --s 500
Bello... ma manca una cosa: il vecchio Albert stesso. Dato che Interactive ha un'interfaccia basata sulla chat, gli ho semplicemente detto di aggiungerlo al prompt:

Ho quindi ottenuto:
Albert Einstein with a colorful punk hairstyle in vibrant pink, orange, and
gray hues, wearing an edgy jacket adorned with spikes and colorful geometric
patterns, set against an urban background with bokeh lighting, cyberpunk
aesthetic --ar 4:5 --v 6 --stylize 500
Noterai che non è esattamente lo stesso prompt che ho usato per creare l'immagine iniziale. Questo è perfettamente normale - in primo luogo perché le immagini generate dall'AI incorporano caratteristiche oltre il prompt usato per crearle. Per esempio, nell'immagine iniziale, Einstein guarda a destra e ha una macchia rossa sul risvolto - non ho specificato questi dettagli nel prompt, quindi se fai reverse engineering di un prompt dall'immagine, non otterrai semplicemente lo stesso prompt con cui hai iniziato. La seconda ragione è che il modello di analisi dell'immagine (come molta AI) è non deterministico -- puoi chiedere una seconda volta di fare reverse engineering di un prompt dalla stessa immagine e potrebbe cogliere dettagli diversi.
Comunque, ora che abbiamo un prompt, possiamo cliccare il pulsante "send to Assistant" per generare quattro immagini in stile Midjourney:


Ancora una volta, puoi vedere che non corrisponde all'immagine iniziale, e non lo farà mai. Prova semplicemente a inserire lo stesso prompt in un modello di generazione di immagini una seconda volta e otterrai risultati completamente diversi - come il modello di riconoscimento delle immagini è non deterministico.
Mi piace molto l'immagine in alto a sinistra. Cliccandola posso scegliere di ingrandirla, ed ecco la mia immagine finale dello zio fisico preferito da tutti con i capelli pazzi:

Naturalmente, puoi anche testare il prompt in Midjourney vero e proprio, e otterrai risultati simili:

tagAltri Esempi
Ecco alcuni altri esempi. L'ordine del contenuto è:
- Prompt iniziale
- Immagine generata su Midjourney
- Prompt ricostruito
- Immagine in stile Midjourney generata su PromptPerfect Interactive
tagPiccione Turbo
abstract, minimalist mesh wireframe of A pigeon::4 , wearing a helmet and
carrying a turbo booster on its back, with a gradient of green, cyan, and blue
lines against a black background, Vanishing point, with minimal detailing::4 ,
--ar 16:9 --s 750 --v 6.0

Futuristic bird with neon lights, intricate feather details, glowing pink and
blue colors, highly detailed, digital art, ethereal and luminous, dark
background, dynamic light streaks, cybernetic effect, hyper-realistic --ar
16:9 --v 6 --stylize 750

tagCervello che si Scioglie
melting brain, floating in space, plain black background --ar 16:9 --niji 6
--s 750

Surreal, melting brain suspended in space, dripping neon pink and blue colors,
abstract, fluid textures, hyper-detailed, futuristic, digital art, cosmic
background with stars, vibrant and glowing, soft lighting --ar 16:9 --v 6
--stylize 750

tagPrincipessa Leia di Bollywood
Bollywood Star Wars scene, close up shot of Princess Leia Organa in traditional
Indian attire, intricate jewelry, holding a defender sporting blaster pistol,
vibrant colors, futuristic elements, sci-fi, dramatic lighting, detailed
background, cinematic, 8K resolution, Unreal Engine, --ar 4:5 --v 6.0

Princess Leia, holding a blaster, futuristic sci-fi setting, white robe,
detailed hair buns, dramatic lighting, heroic pose, vibrant colors, cinematic
scene, intricate background with glowing elements --ar 4:5 --s 500 --v 6

Hmm... devo dire che mi manca davvero l'aspetto Bollywood. Questo è un fatto della reverse engineering - a volte l'algoritmo di analisi delle immagini non vede qualcosa che un umano vedrebbe. Dopo un po' di aggiustamenti (un termine tecnico altamente specializzato nel prompt engineering), ho raffinato il prompt così:
Princess Leia, holding a blaster, futuristic sci-fi setting, dressed in a
white robe with intricate Indian embroidery, ethnically Indian with
traditional Indian facial features, detailed hair buns adorned with
traditional Indian jewelry, dramatic lighting, heroic pose, vibrant colors,
Bollywood-inspired design, charismatic expression, cinematic scene, intricate
background with glowing elements and traditional Indian patterns --ar 4:5 --s
500 --v 6
Che mi ha dato questa immagine:

Questo è dove l'ottimizzatore interattivo brilla davvero. Se fossi stato solo io, avrei semplicemente aggiunto il termine bollywood
al prompt. Ma chiedendo all'ottimizzatore di Refine this Midjourney-style prompt to include more Bollywood vibes
PromptPerfect ha aggiunto più parole descrittive al prompt (traditional Indian patterns
, ecc.). Aggiungere più parole e dettagli che suggeriscono un risultato specifico è solitamente un modo molto migliore per influenzare l'immagine generata rispetto al modificare pesi e stili.
tagMedaglia Pastello
a medal is sitting on a podium against pastel colored confetti, in the style
of simplified forms and shapes, yellow and beige, columns and totems, playful
streamlined forms, nerdcore, contest winner, repetition and pattern --ar 64:39
--s 750 --v 6.0

Award medal, intricate laurel design, suspended from a ribbon, celebratory
background, vibrant confetti, glowing lights, high detail, 3D render, soft
lighting, pink and blue color scheme, festive atmosphere --ar 16:9 --s 500
--v 6 --stylize 750

tagInizia il Reverse Engineering delle Immagini
Per iniziare a utilizzare PromptPerfect per il reverse engineering dei prompt delle immagini, registrati e prova un piano a pagamento di PromptPerfect gratuitamente per sette giorni. E abbonati a un piano entro 24 ore dal tuo primo accesso per ottenere uno sconto del 40%:

Sai che è l'unico modo per rimanere un passo avanti a quei leopardi AI affamati!