
Современные генераторы изображений позволяют получать по-настоящему атмосферные картинки, однако, как рассказал программист Никита Полянин корреспонденту REGIONS, итог во многом зависит не от самой технологии, а от того, насколько точно и грамотно сформулирован запрос.
По его словам, большинство популярных моделей изображений — Sora, DaVinci, Nano Banana (Gemini) и десятки других — работают по схожему принципу.
«Они собирают конечный результат на основе семантической структуры текста, а не отдельных слов. Поэтому качество картинки почти полностью зависит от того, насколько точно вы формализовали сцену», — рассказал Никита Полянин.
Именно поэтому ключевую роль играет так называемый промпт — текстовый запрос, с помощью которого пользователь объясняет нейросети, какое изображение он хочет получить.
«По сути, это подробная инструкция для генератора: что должно быть в кадре, в каком стиле, при каком освещении и с каким настроением. Промпт — это не одно слово, а целостное описание сцены», — поделился специалист.
Это базовый элемент, вокруг которого строится сцена.
Плохо: елка
Хорошо: a decorated Christmas tree with warm yellow lights, standing in the center of a snowy village square (украшенная рождественская елка с теплыми желтыми огнями, стоящая в центре заснеженной деревенской площади).
Почему: модели пытаются угадать смысл одного слова, а значит появляются искажения. Чем яснее субъект, тем стабильнее результат.
Для нейросети «елка» может быть где угодно. Контекст резко снижает количество артефактов.
Формула примерная: Предмет + Окружающая среда + Цель
Пример: a snowman in a pine forest, fresh snow falling, early sunset light (снеговик в сосновом лесу, падает свежий снег, свет раннего заката).
Даже если в кадре ничего не происходит, указание действия улучшает качество, а модель понимает, что должно быть.
Примеры: children building a snowman a deer quietly standing in a snowy meadow a cabin glowing with warm light (дети лепят снеговика, олень спокойно стоит на заснеженном лугу, хижина светится теплым светом).
Для большинства моделей стиль — это «режим рендера». Без него можно получить случайный набор художественных приемов.
Примеры стилей: watercolor illustration (акварельная иллюстрация), photorealistic (фотореалистичная), cinematic scene (кинематографическая сцена), anime-style (в стиле аниме), vector art (векторная графика), retro 80s neon (неоновое ретро 80-х).
«Выбрали стиль — значит уменьшили вариативность модели и повысили предсказуемость результата», — подчеркнул Никита Полянин.
Изображение без света — это половина информации. Модели особенно чувствительны к световым условиям.
Рабочие маркеры: soft warm lighting (мягкое теплое освещение), golden hour light (золотой часовой свет), cold blue moonlight (холодный голубой лунный свет), volumetric light (объемный свет), cinematic shadows (кинематографические тени).
Освещение определяет эмоциональный тон и глубину изображения.
Обычно модели предполагают средний план, если нет уточнений. Поэтому композицию лучше задавать явно.
Примеры: close-up portrait (портрет крупным планом), wide landscape shot (широкий ландшафтный снимок), center composition (центральная композиция), symmetrical layout (симметричное расположение), rule of thirds (правило третей)
Композиция дает больше контроля над тем, что именно попадет в кадр.
Анти-промпты помогают снизить визуальный шум.
Типовые фразы: no text, no watermark, no blur, no extra limbs, no distortion, clean edges (ни текста, ни водяных знаков, ни размытия, ни лишних выступов, ни искажений, четкие края).
Логическая структура промпта выглядит следующим образом:
Пример итогового запроса: A cozy snowy village at night, children building a snowman near warm lanterns, watercolor illustration, soft golden light, center composition, high detail, no text, no artifacts (Уютная заснеженная деревня ночью, дети лепят снеговика возле теплых фонарей, акварельная иллюстрация, мягкий золотистый свет, центральная композиция, высокая детализация, никакого текста, никаких артефактов.
«Промпт должен выглядеть так, будто вы объясняете человеку, что именно нужно нарисовать. Если формулировка понятна дизайнеру, то она будет понятна и нейросети», — заключил Никита Полянин.
Указанные сведения носят информационно-аналитический характер, собраны на основе информации, размещенной в открытых источниках и не являются рекламой.
Ранее REGIONS сообщил, в какие дни декабря квасить капусту по лунному календарю.