Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя
Привет! Миджорни закрыл бесплатную тестовую генерацию!  · 10 апр 2023

Midjourney: урок "как правильно писать промты". Cпойлер: делюсь промтами + 1 крутое упражнение, улучшающее промты

Мы отвечаем: «мы не делимся своими промтами. Ведь они — как главный ингредиент в изображении, которое вас вдохновило. Сутки за сутками мы проводим в экспериментах, чтобы найти «тот самый» промт и представить на ваш суд изображение, которое вас так вдохновляет.
Мы любим создавать яркие и необычные работы.
Дочитайте до конца: промтами я все же поделюсь.
Листая соцсети, я увидел очередной «суперзаряженный» промт на полстраницы и решил написать пост о том, как работать с промтами.
portrait of indian village woman at a gathering in the forests of Himachal Pradesh, Cinematic, Photoshoot, Shot on 25mm lens, Depth of Field, DOF, Tilt Blur, Shutter Speed 1/1000, F/22, White Balance, 32k, Super-Resolution, Megapixel, Pro Photo RGB, VR, Lonely, Good, Massive, Half rear Lighting, Backlight, Dramatic Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Conte-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, Ray Traced, ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cell Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hyper maximalist, elegant, super detailed, dynamic pose, photography, volumetric, ultra-detailed, intricate details, 8K, super detailed, ambient –uplight
Wow, подумал я, вот это терпение. Дописать до конца такой огромный промт — это достойно уважения. Вы, конечно же, хотите увидеть результат? Вот он:
Вполне неплохое изображение. Нужен ли такой длинный промт? Отвечу в этом разборе.
Я надел очки и стал читать слово за словом. И с каждым новым словом моя улыбка становилась все шире. Совершенно очевидно, что автор промта хотел добиться максимальной фотографичности изображения. Но зачем же СТОЛЬКО "умных" слов?
Проанализирую лишь одно слово: SFX. У него миллион знаений: звуковые эффекты, самораспаковывающийся архив, имя английского журнала о научной фантастике. А еще это аббревиатура от словосочетания Spread Firefox — из рекламной компании одноименного браузера.
И как, предполагал автор промта, Midjourney должна интерпретировать эти три буквы, применительно к генерации пожилой женщины из индийской деревне?
Правильно — никак. Mj версии "пять" (да и "четверка" тоже — я провел нижеописанный тест полностью в обеих версиях), умничка и просто проигнорировала это слово. Как и десятки других.
Когда вы дочитате эту статью я вам это докажу и вы поймете, как ПРАВИЛЬНО писать промты, не перегружая их «мусором», который совершенно не нужен. Шаг за шагом я произведу декомпозицию промта (это суперполезное упражнение я рекомендую провести с любым из ваших промтов), чтобы на примерах показать, что влияет на итоговую генерацию, а что нет. Более того, поймете, что принцип декомпозиции, о котором я пишу, работает и в обратном направлении.
«Промтостроение» — это искусство
Поэтому держим свои know how в тайне. Как повара — свои фирменные рецепты.
Возможно вы этого не заметили. Но началась новая «золотая лихорадка». Все устремились в цифровой Клондайк. Креативные агенства, пиарщики, простые люди, бренды — каждый хочет решить свою корыстную задачу, задействуя силу ИИ.
Но тут возникает главный облом — как сделать так, чтобы картинки отличались от всех остальных?
Тут-то и приходит понимание, что именно промты — «золото», не картинки. Промтостроитель — старатель, проводящий нудные часы на берегу цифровой реки, просеивая песок слов, чтобы найти золотой самородок: свое идеальное изображение.
Многие ошибочно думают, что с помощью ИИ легко получить то, что вы хотите, и поэтому в их представлении «рисование картинок в нейросетях» — мошенничество и кража чужой работы. Но в действительности, я вижу, как сеть наводнили однотипные изображения тех людей, которые пришли в Midjourney на хайпе и решили тоже «творить». Все картинки однотипные, скучные и однообразные, и именно из-за таких людей (которые не разобрались в том, как все работает), MJ незаслуженно обвиняют в том, что она рисует одинаковые картинки.
Пчела. Mj V5. Итог экспериментов с углом съемки, крупностью плана и освещением.
Некоторые люди говорят, что искусство ИИ — это репликация чужих талантов, а не искусство. Для некоторых — это просто инструмент разочарованных творцов, чтобы смешать популярные культурные ценности или эстетику вместе в попытке получить «лайки» в соцсетях.
Некоторые говорят, что «ИИ-рисовалки» — средство для создания нереалистичных стандартов красоты, чтобы люди могли навязывать свои личные предпочтения в отношении привлекательности вымышленным людям, чтобы избежать взаимодействия с несовершенством в реальном мире.
Некоторые говорят, что это шанс для тех, у кого нет воображения, наступить на плечи творческих гениев, которые десятилетиями осваивали мастерство, стремились создать собственный бренд.
Но все в действительности не так просто.
Я уверен, что инженер промтов — карьера будущего. Поезд уже отходит и скоро наберет очень большую скорость. Но места в вагонах пока еще есть.

А на каждый из вышеперечисленных пунктов я отвечу — нет. Я говорю: «Люди, работающие ИИ, сами по себе творцы. Мы используем развивающиеся технологии, чтобы расширить границы нашего собственного безграничного воображения».
Работа над проптом требует времени и обучения — как и со всеми инструментами, физическими или цифровыми. Итак, нейропоезд уже отходит — на большой скорости — но еще есть место для многих людей. Я предпочитаю быть в поезде, даже если он сойдет с рельсов.
Я приглашаю всех попробовать и убедиться на личном опыте, что все не так просто. Необязательно платить — та же Midjourney дает бесплатные 25 изображений для теста. Есть бесплатные ИИ.
Переходим к декомпозиции промта и разбираемся, как все работает
А теперь обещанное. Я расскажу, как можно работать с промтами и отсеивая все лишнее.
Итак, вернемся к промту в начале. Вы удивитесь, но такого же качества можно добиться лишь 1 «ключом» (одним параметром в промте) и сейчас я вам это докажу. Но давайте разберемся с тем, как писать промты.
В начале этот статьи, я привел огромный промт. Сейчас я возьму скальпель своего знания и начну резать его слово за словом. Для начала выкинем весь откровенный мусор и увидим ничего не меняется (за исключением лица, что естественно). После выброса "заумных" терминов, у нас остался такой промт:
portrait of Indian village woman at a gathering in the forests of Himachal Pradesh , Cinematic, Photoshoot, Shot on 25mm lens, Depth of Field, Tilt Blur, Shutter Speed 1/1000, F/22, White Balance, 32k, Super-Resolution, Pro Photo RGB, Half rear Lighting, Backlight, Dramatic Lighting, Incandescent, Soft Lighting, Volumetric, Conte-Jour, Global Illumination, Screen Space Global Illumination, Scattering, Shadows, Rough, Shimmering, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, OpenGL-Shader’s, Post Processing, Post-Production, Cell Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hyper maximalist, elegant, dynamic pose, photography, volumetric, ultra-detailed, intricate details, super detailed, ambient --uplight --v 4 --q 2
Режем дальше:
portrait of an indian village woman in forest in Himachal pradesh, clear facial features, Cinematic, 35mm lens, f/1.8, accent lighting, global illumination.
Чуть видоизменяем
portrait of indian village woman at a gathering in the forests, digital photograph, soft natural light, 50mm lens, f1.8 aperture.
Упрощаем дальше:
portrait of indian village woman in the forests, digital photograph, soft natural light, 50mm lens, f1.8 aperture
А что если отрезать еще кусок и убрать 1.8 Aperture?:
portrait of indian village woman in the forests, digital photograph, soft natural light, 50mm lens
А теперь избавимся от 50mm lens:
portrait of indian village woman in the forests, digital photograph, soft natural light
Следующим шагом пустим под нож параметр soft natural light.
portrait of indian village woman in the forests, digital photograph
Ничего не меняется. Кэп, что случилось?! :-)))
Отрезаем digital photograph
portrait of indian village woman in the forests
Отрезаем in the forests.
portrait of indian village woman
И только на этом этапе мы видим значимое изменение. Поменялись цвета изображения. Параметр in the forests задавал "зеленые оттенки". Поэтому, если бы мы захотели увидеть женщину в красном, мы должны были бы написать:
portrait of indian village woman in red dress the forests
Проверим резульльтат этого промта (да, все рабтает):
Но давайте продолжим резать исходный промт. Мы же решили действовать радикально. Так что мы оставим только:
indian village woman
Ну и как тебе такое, Илон Маск?
Проанализируем, с чего мы начали и к чему пришли. Было:
portrait of indian village woman at a gathering in the forests of Himachal Pradesh, Cinematic, Photoshoot, Shot on 25mm lens, Depth of Field, DOF, Tilt Blur, Shutter Speed 1/1000, F/22, White Balance, 32k, Super-Resolution, Megapixel, Pro Photo RGB, VR, Lonely, Good, Massive, Half rear Lighting, Backlight, Dramatic Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Conte-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, Ray Traced, ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cell Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hyper maximalist, elegant, super detailed, dynamic pose, photography, volumetric, ultra-detailed, intricate details, 8K, super detailed, ambient –uplight
Стало:
indian village woman
Тут я не могу не добавить: LOL.
Все генерации сделаны в Midjourney v5. Точно такой же эксперимент я провел в версии 4. И могу сделать однозначное утрвеждение: новая версия заточена делать фотографии прямо из коробки. Если вы хотите сделать стилизацию (под иллюстрацию, и тд) — это теперь НУЖНО указывать в промте обязательно. Если же вы хотите сделать фото — стало проще.
В четвертой версии занчимые изменения случились на этапе, когда я убрал из этого промта — portrait of indian village woman at a gathering in the forests, f1.8 aperture — параметр "f1.8 aperture". Фотография стала иллюстрацией. В "пятерке" все не так.
Итак. Этот пример декомпозиции промта я привел для того, чтобы вы поняли, что простые промты — самые крутые промты.
Как я уже писал выше, процесс декомпозиции можно (и нужно) проводить в обратном порядке, нанизывая новые данные на промт и анализируя, как меняется изображение.
Если же говорить о формуле промта, то вот, итоговое резюме:
Промты стоит писать по такой формуле:
[ОБЪЕКТ] [ЛОКАЦИЯ] [ПАРАМЕТРЫ ОСВЕЩЕНИЯ] [ТЕХНИЧЕСКИЕ ПАРАМЕТРЫ — такие, как --ar 16:9 и т.д.]
Творите, ищите свои промты, и не выпрашивайте промты у других. Как я уже написал в самом начале статьи: создавать промты — это искусство.