Эй ты! Да, ты, читающий это. Промпт-инженер, который тратит слишком много времени на Midjourney и другие модели генерации изображений. Этот пост именно для тебя.
«Я никогда не думала, чтолеопардыИИ съест МОЕ лицо», — рыдает женщина, проголосовавшая за ПартиюЛеопардовИИ, Поедающих Лица Людей.
Когда ИИ поглощает всё больше рабочих мест, мы также можем сказать:
Сначала ИИ пришел за художниками, и я промолчал — потому что я не был художником. Затем он пришел за промпт-инженерами (которые использовали ИИ, чтобы сначала снести художников), и я попал впросак, потому что это была моя работа.
Именно так, приятель. Ты поставил "mid" в Midjourney. Твой Stable Diffusion больше похож на нестабильную путаницу. А твои навыки DALL-E на самом деле CRAP-E. С такими инструментами, как PromptPerfect, любой может просто реверс-инжинирить существующие изображения для создания промптов или генерировать промпты с обратной связью от человека в реальном времени, шаг за шагом.
Итак, давайте разберемся, как вы можете реверс-инжинирить промпты из изображений, чтобы оставаться впереди ИИ-леопардов, которые хотят съесть ваше лицо... по крайней мере, пока.
tagPromptPerfect Interactive
PromptPerfect Interactive трансформирует способ генерации контента и решения сложных задач. Он построен на двойном подходе:
- Dedicated Assistant: ИИ-компаньон, который понимает ваши потребности и помогает создавать эффективные промпты, делая процесс генерации контента максимально простым.
- Powerful Optimizer: Продвинутый инструмент, который оптимизирует ваши промпты для получения наилучших результатов, гарантируя, что ваши творческие и продуктивные начинания станут более эффективными, чем когда-либо.
PromptPerfect недавно представил генерацию изображений в стиле Midjourney, поэтому в этом посте мы будем использовать ассистента и оптимизатор Interactive для реверс-инжиниринга промптов из изображений, а затем генерировать новые изображения на основе этих промптов в стиле Midjourney.
tagКак делать реверс-инжиниринг промптов изображений
Для начала нам нужно изображение, с которым можно работать. Давайте используем это изображение панк-Эйнштейна, которое я ранее сгенерировал в Midjourney:

Для генерации изображения я использовал этот промпт в Midjourney:
Realistic photo of Albert Einstein as a punk, retaining his recognizable facial
features, with a brightly colored mohawk, visible tattoos, facial piercings,
and wearing a spiked leather jacket, highly detailed, photorealistic, vibrant
colors, dramatic lighting --ar 4:5 --s 500 --v 6
Затем я загрузил изображение в интерактивный ассистент PromptPerfect и попросил его сгенерировать промпт на основе этого изображения:

Промпт, который он вернул:
Colorful punk hairstyle, vibrant pink, orange, and gray hair, edgy jacket with
spikes and colorful geometric patterns, urban background, bokeh lighting,
cyberpunk aesthetic --ar 4:5 --v 6 --s 500
Неплохо... но не хватает одной вещи: самого старины Альберта. Поскольку Interactive имеет чат-интерфейс, я просто попросил добавить его в промпт:

И получил:
Albert Einstein with a colorful punk hairstyle in vibrant pink, orange, and
gray hues, wearing an edgy jacket adorned with spikes and colorful geometric
patterns, set against an urban background with bokeh lighting, cyberpunk
aesthetic --ar 4:5 --v 6 --stylize 500
Вы заметите, что это не точно тот же промпт, который я использовал для создания исходного изображения. Это совершенно нормально — во-первых, потому что ИИ-генерированные изображения включают функции, выходящие за рамки используемого промпта. Например, на исходном изображении Эйнштейн смотрит вправо и имеет красное пятно на лацкане — я не указывал этого в промпте, поэтому если вы делаете реверс-инжиниринг промпта из изображения, вы не получите обратно тот же промпт, с которого начали. Вторая причина в том, что модель анализа изображений (как и большая часть ИИ) недетерминирована — вы можете попросить её второй раз сделать реверс-инжиниринг промпта из того же изображения, и она может заметить другие детали.
В любом случае, теперь, когда у нас есть промпт, мы можем нажать кнопку "send to Assistant", чтобы сгенерировать четыре изображения в стиле Midjourney:


Опять же, вы видите, что оно не соответствует исходному изображению, и никогда не будет соответствовать. Просто попробуйте ввести тот же промпт в модель генерации изображений во второй раз, и вы получите совершенно другие результаты — как и модель распознавания изображений, она недетерминирована.
Мне очень нравится изображение в верхнем левом углу. Нажав на него, я могу выбрать увеличение, и вуаля, вот моё финальное изображение любимого всеми чудаковатого дядюшки физики:

Конечно, вы также можете протестировать промпт непосредственно в Midjourney и получите похожие результаты:

tagБольше примеров
Вот еще несколько примеров. Порядок содержимого:
- Исходный промпт
- Изображение, сгенерированное в Midjourney
- Реконструированный промпт
- Изображение в стиле Midjourney, сгенерированное в PromptPerfect Interactive
tagТурбо-голубь
abstract, minimalist mesh wireframe of A pigeon::4 , wearing a helmet and
carrying a turbo booster on its back, with a gradient of green, cyan, and blue
lines against a black background, Vanishing point, with minimal detailing::4 ,
--ar 16:9 --s 750 --v 6.0

Futuristic bird with neon lights, intricate feather details, glowing pink and
blue colors, highly detailed, digital art, ethereal and luminous, dark
background, dynamic light streaks, cybernetic effect, hyper-realistic --ar
16:9 --v 6 --stylize 750

tagТающий мозг
melting brain, floating in space, plain black background --ar 16:9 --niji 6
--s 750

Surreal, melting brain suspended in space, dripping neon pink and blue colors,
abstract, fluid textures, hyper-detailed, futuristic, digital art, cosmic
background with stars, vibrant and glowing, soft lighting --ar 16:9 --v 6
--stylize 750

tagПринцесса Лея в стиле Болливуда
Bollywood Star Wars scene, close up shot of Princess Leia Organa in traditional
Indian attire, intricate jewelry, holding a defender sporting blaster pistol,
vibrant colors, futuristic elements, sci-fi, dramatic lighting, detailed
background, cinematic, 8K resolution, Unreal Engine, --ar 4:5 --v 6.0

Princess Leia, holding a blaster, futuristic sci-fi setting, white robe,
detailed hair buns, dramatic lighting, heroic pose, vibrant colors, cinematic
scene, intricate background with glowing elements --ar 4:5 --s 500 --v 6

Хмм... должен сказать,что очень не хватает болливудского аспекта. Это особенность обратной инженерии - иногда алгоритм анализа изображений не видит того,что заметил бы человек. После некоторых манипуляций (очень технический термин в промпт-инжиниринге),я усовершенствовал промпт до этого:
Princess Leia, holding a blaster, futuristic sci-fi setting, dressed in a
white robe with intricate Indian embroidery, ethnically Indian with
traditional Indian facial features, detailed hair buns adorned with
traditional Indian jewelry, dramatic lighting, heroic pose, vibrant colors,
Bollywood-inspired design, charismatic expression, cinematic scene, intricate
background with glowing elements and traditional Indian patterns --ar 4:5 --s
500 --v 6
Что дало мне такое изображение:

Вот где интерактивный оптимизатор действительно блистает. Если бы это делал я,то просто добавил бы слово bollywood
в промпт. Но когда я попросил оптимизатор Refine this Midjourney-style prompt to include more Bollywood vibes
,PromptPerfect добавил больше описательных слов в промпт (traditional Indian patterns
и т.д.). Добавление большего количества слов и деталей,предполагающих определенный результат,обычно является гораздо лучшим способом повлиять на сгенерированное изображение,чем возиться с весами и стилями.
tagПастельная медаль
a medal is sitting on a podium against pastel colored confetti, in the style
of simplified forms and shapes, yellow and beige, columns and totems, playful
streamlined forms, nerdcore, contest winner, repetition and pattern --ar 64:39
--s 750 --v 6.0

Award medal, intricate laurel design, suspended from a ribbon, celebratory
background, vibrant confetti, glowing lights, high detail, 3D render, soft
lighting, pink and blue color scheme, festive atmosphere --ar 16:9 --s 500
--v 6 --stylize 750

tagНачните обратную разработку изображений
Чтобы начать использовать PromptPerfect для обратной разработки промптов изображений, зарегистрируйтесь и попробуйте платный план PromptPerfect бесплатно в течение семи дней. При подписке на план в течение 24 часов после первого входа вы получите скидку 40%:

Вы знаете, что это единственный способ оставаться впереди этих голодных AI-леопардов!