嘿,你!对,说的就是你,正在阅读这篇文章的人。你这个在 Midjourney 和其他图像生成模型上花费太多时间的提示工程师。这篇文章就是为你准备的。
"我从没想过豹子人工智能会吃掉我的脸,"这位投票支持豹子人工智能吃人脸党的女士哭诉道。
随着 AI 吞噬越来越多的工作,我们也可以说:
AI 首先来找艺术家,我没有发声 – 因为我不是艺术家。然后它来找提示工程师(那些用 AI 推倒艺术家的人),我被整惨了因为那是我的工作。
没错,伙计。你给 Midjourney 加上了"平庸"。你的 Stable Diffusion 更像是不稳定混乱。而你的 DALL-E 技能实际上是 CRAP-E。有了 PromptPerfect 这样的工具,任何人都可以简单地逆向工程现有图像来生成提示,或者通过人工实时逐步反馈来生成提示。
那么,让我们来看看如何从图像中逆向工程提示,这样你就可以暂时领先那些想要吃掉你的脸的 AI 豹子...至少现在是这样。
tagPromptPerfect Interactive
PromptPerfect Interactive 改变了你生成内容和处理复杂任务的方式。它建立在双重方法上:
- 专属助手:一个理解你需求并帮助你制作有效提示的 AI 伙伴,让内容生成过程尽可能顺畅。
- 强大优化器:一个高级工具,可以微调你的提示以获得最佳结果,确保你的创意和生产工作比以往更有效率。
PromptPerfect 最近推出了 Midjourney 风格的图像生成,所以在这篇文章中,我们将使用 Interactive 的助手和优化器从图像中逆向工程提示,然后用这些提示以 Midjourney 的风格生成新图像。
tag如何逆向工程图像提示
首先,我们需要一个样本图像。让我们使用这张我之前在 Midjourney 生成的朋克爱因斯坦图像:

为了生成这张图像,我在 Midjourney 中使用了这个提示:
Realistic photo of Albert Einstein as a punk, retaining his recognizable facial
features, with a brightly colored mohawk, visible tattoos, facial piercings,
and wearing a spiked leather jacket, highly detailed, photorealistic, vibrant
colors, dramatic lighting --ar 4:5 --s 500 --v 6然后我将图像上传到 PromptPerfect 的 Interactive Assistant,并让它基于该图像生成提示:

它返回的提示是:
Colorful punk hairstyle, vibrant pink, orange, and gray hair, edgy jacket with
spikes and colorful geometric patterns, urban background, bokeh lighting,
cyberpunk aesthetic --ar 4:5 --v 6 --s 500不错...但缺少了一件事:老爱因斯坦本人。由于 Interactive 有基于聊天的界面,我只需告诉它将他添加到提示中:

然后我得到了:
Albert Einstein with a colorful punk hairstyle in vibrant pink, orange, and
gray hues, wearing an edgy jacket adorned with spikes and colorful geometric
patterns, set against an urban background with bokeh lighting, cyberpunk
aesthetic --ar 4:5 --v 6 --stylize 500你会注意到这个提示与我用来创建初始图像的提示并不完全相同。这很正常 - 首先是因为 AI 生成的图像包含了超出用来创建它们的提示的特征。例如,在初始图像中,爱因斯坦向右看,他的翻领上有一抹红色 - 我在提示中并没有指定这些,所以如果你从图像中逆向工程提示,你不会得到与开始时相同的提示。第二个原因是图像分析模型(像很多 AI 一样)是非确定性的 -- 你可以第二次要求它从同一图像逆向工程提示,它可能会捕捉到不同的细节。
无论如何,现在我们有了提示,我们可以点击"发送给助手"按钮来生成四张 Midjourney 风格的图像:


再次,你可以看到它与初始图像不匹配,而且永远不会匹配。只要试着将相同的提示第二次输入图像生成模型,你就会得到完全不同的结果 - 就像图像识别模型一样,它是非确定性的。
我特别喜欢左上角的图像。通过点击它,我可以选择放大,瞧,这就是我最终得到的这位人人都爱的疯狂头发物理学叔叔的图像:

当然,你也可以在 Midjourney 本身测试这个提示,你会得到类似的结果:

tag更多示例
这里有一些更多的示例。内容顺序为:
- 初始提示词
- 在 Midjourney 上生成的图像
- 反向推导的提示词
- 在 PromptPerfect Interactive 上生成的 Midjourney 风格图像
tag涡轮鸽子
abstract, minimalist mesh wireframe of A pigeon::4 , wearing a helmet and
carrying a turbo booster on its back, with a gradient of green, cyan, and blue
lines against a black background, Vanishing point, with minimal detailing::4 ,
--ar 16:9 --s 750 --v 6.0
Futuristic bird with neon lights, intricate feather details, glowing pink and
blue colors, highly detailed, digital art, ethereal and luminous, dark
background, dynamic light streaks, cybernetic effect, hyper-realistic --ar
16:9 --v 6 --stylize 750
tag融化的大脑
melting brain, floating in space, plain black background --ar 16:9 --niji 6
--s 750
Surreal, melting brain suspended in space, dripping neon pink and blue colors,
abstract, fluid textures, hyper-detailed, futuristic, digital art, cosmic
background with stars, vibrant and glowing, soft lighting --ar 16:9 --v 6
--stylize 750
tag宝莱坞莱娅公主
Bollywood Star Wars scene, close up shot of Princess Leia Organa in traditional
Indian attire, intricate jewelry, holding a defender sporting blaster pistol,
vibrant colors, futuristic elements, sci-fi, dramatic lighting, detailed
background, cinematic, 8K resolution, Unreal Engine, --ar 4:5 --v 6.0
Princess Leia, holding a blaster, futuristic sci-fi setting, white robe,
detailed hair buns, dramatic lighting, heroic pose, vibrant colors, cinematic
scene, intricate background with glowing elements --ar 4:5 --s 500 --v 6
嗯……不得不说,我真的很想念宝莱坞的风格。这就是反向工程的事实 —— 有时图像分析算法看不到人类能看到的东西。经过一番调整(这是一个高度专业的提示词工程术语),我完善了提示词如下:
Princess Leia, holding a blaster, futuristic sci-fi setting, dressed in a
white robe with intricate Indian embroidery, ethnically Indian with
traditional Indian facial features, detailed hair buns adorned with
traditional Indian jewelry, dramatic lighting, heroic pose, vibrant colors,
Bollywood-inspired design, charismatic expression, cinematic scene, intricate
background with glowing elements and traditional Indian patterns --ar 4:5 --s
500 --v 6这给我生成了这张图:

这就是交互式优化器真正闪光的地方。如果只是我个人,我会简单地在提示词中加入 bollywood 一词。但是通过要求优化器 Refine this Midjourney-style prompt to include more Bollywood vibes,PromptPerfect 在提示词中添加了更多描述性词语(traditional Indian patterns 等)。添加更多暗示特定结果的词语和细节,通常比调整权重和风格更好地影响生成的图像。
tag粉彩奖牌
a medal is sitting on a podium against pastel colored confetti, in the style
of simplified forms and shapes, yellow and beige, columns and totems, playful
streamlined forms, nerdcore, contest winner, repetition and pattern --ar 64:39
--s 750 --v 6.0
Award medal, intricate laurel design, suspended from a ribbon, celebratory
background, vibrant confetti, glowing lights, high detail, 3D render, soft
lighting, pink and blue color scheme, festive atmosphere --ar 16:9 --s 500
--v 6 --stylize 750
tag开始逆向工程图像
要开始使用 PromptPerfect 进行图像提示词逆向工程,请注册并免费试用付费版 PromptPerfect 七天。在首次登录后 24 小时内订阅计划可获得 40% 的优惠:

你知道这是在 AI 领域保持领先的唯一方式!







