Структура промпта
Универсальная структура, которая работает для большинства задач: субъект → действие → окружение → стиль → технические параметры. Каждый блок отвечает на конкретный вопрос:
- Субъект — кто или что в кадре
- Действие — что происходит, в какой позе
- Окружение — где это происходит, что вокруг
- Стиль — фотореализм, иллюстрация, 3D, конкретная техника
- Технические параметры — освещение, ракурс, объектив, цветовая палитра
Пример структурированного промпта:
Молодая женщина в белом халате врача, сидит за рабочим столом, держит планшет, изучает данные пациента. Современный медицинский кабинет с большими окнами, мягкое естественное освещение слева. Реалистичная фотография, объектив 50мм, глубина резкости f/2.8, нейтральная цветовая палитра. Практические подсказки
Короткие ответы для частых ситуаций — что писать в промпте, а что лучше настраивать в параметрах запроса.
Если вы редактируете фото
Пишите не «сделай лучше», а что именно нужно поменять: «убери людей сзади», «замени фон на офис», «оставь лицо без изменений».
Если вы загрузили несколько референсов
Укажите, что брать из каждого: «возьми лицо с фото 1, одежду с фото 2, фон с фото 3».
Если вам нужен текст на картинке
Пишите точную фразу в кавычках и указывайте язык. Для текста на картинке лучше подходят Nano Banana 2, Nano Banana Pro и Qwen Image.
Если нужен прозрачный фон
Модели не умеют генерировать прозрачность напрямую. Попросите одноцветный фон — например, сплошной чёрный — а затем удалите его моделью Recraft Remove Background. Получите чистый PNG с прозрачностью.
Если хотите задать разрешение или формат
Не пишите в промпте «сделай в 4K» или «соотношение 3:2» — модель это проигнорирует. Разрешение и соотношение сторон выбираются в параметрах запроса перед генерацией.
Если результат вам не нравится
Меняйте по одному параметру за раз: сначала стиль, потом свет, потом ракурс. Иначе будет сложно понять, что именно улучшило картинку.
Что означают настройки
Кроме самого промпта, у каждой модели есть набор параметров, которые задаются до запуска. Это разрешение, соотношение сторон, тип выходного файла и ряд модель-специфичных опций. В промпте их прописывать не нужно — модель проигнорирует.
Разрешение: 1K, 2K, 4K
Разрешение отвечает за детализацию картинки.
- 1K — быстрее и дешевле. Подходит для тестов, идей, соцсетей и быстрых черновиков.
- 2K — золотая середина. Уже больше деталей, хороший вариант для большинства задач.
- 4K — максимум качества, но обычно дороже и медленнее. Нужен для печати, баннеров, коммерческих макетов и сложных сцен.
Если не уверены, начните с 1K или 2K и повышайте разрешение, когда результат уже устраивает по содержанию.
Формат изображения
Формат здесь означает соотношение сторон, а не тип файла.
- 1:1 — квадрат. Для аватарок, карточек и постов.
- 4:5 — вертикальный пост для соцсетей.
- 16:9 — широкий кадр: баннеры, презентации, обложки, видео-превью.
- 9:16 — сторис, Reels, Shorts.
- 3:4 и 4:3 — более классические пропорции фото.
- 21:9 — ультраширокий кадр для кинокомпозиций и шапок.
Выбирайте формат сразу под задачу, чтобы потом не пришлось обрезать важные части изображения.
Тип выходного файла
- PNG — обычно тяжелее, но чище и лучше подходит для графики, текста, интерфейсов и ситуаций, где важна аккуратность.
- JPG / JPEG — легче по весу, хорошо подходит для обычных фотографий и быстрых публикаций.
- MP4 — используется у видеомоделей, если на выходе генерируется ролик, а не картинка.
Прозрачный фон ни одна модель напрямую не выдаёт. Если он нужен — сгенерируйте на одноцветном фоне и прогоните через Recraft Remove Background.
Дополнительные настройки
Эти параметры есть не у всех моделей — состав зависит от выбранной модели.
Качество (medium / high)
Доступно, например, у GPT Image. Medium — для быстрых итераций и черновиков, high — для финального материала. Влияет на стоимость генерации.
Длительность ролика
У видеомоделей задаётся отдельно. Kling — 5 или 10 секунд, Seedance — от 4 до 15 секунд, Grok Video — до 30 секунд. Чем длиннее ролик, тем выше стоимость.
Звук в видео
У Kling 2.6 включает синхронную генерацию речи, эффектов и фона — но дороже, чем без звука. У Seedance звук генерируется нативно вместе с кадром.
Режим (fun / normal / spicy)
У Grok Video управляет характером движения: fun — игровая интерпретация, normal — сбалансированная динамика, spicy — более интенсивное и выразительное движение. При работе с референсами spicy недоступен.
Google Search
Доступен у Nano Banana 2 и Seedance. Подгружает актуальную информацию из веба прямо в контекст запроса — полезно для генераций по свежим темам, событиям и реальным объектам.
NSFW Checker
Дополнительная проверка результата на чувствительный контент. Включайте, когда результат идёт в публичные каналы или в материалы для широкой аудитории.
Частые ошибки
Слишком короткий промпт
Запрос «красивый офис» оставляет модели полную свободу интерпретации, и результат будет случайным. Каждый раз другим. Минимально жизнеспособный промпт содержит хотя бы субъект, окружение и стиль.
Перегруженный промпт
Если запрос содержит десятки требований, модель начнёт игнорировать часть из них. Полезное правило: один запрос — одна сцена. Если нужно несколько связанных кадров, сделайте серию запросов с одинаковой структурой.
Противоречивые указания
«Минималистичная композиция с большим количеством деталей», «фотография в стиле акварели» — такие сочетания создают непредсказуемый результат. Лучше явно выбрать один подход и описать его подробно.
Композиция и кадр
Управление композицией — самый недооценённый рычаг в промптинге. Указывайте:
- План: крупный, средний, общий
- Ракурс: на уровне глаз, сверху, снизу, изометрия
- Фокусное расстояние: 24мм для широких сцен, 50мм для естественной перспективы, 85мм+ для портретов
- Глубину резкости: f/1.4 для сильного боке, f/8 для резкого общего плана
- Композиционные приёмы: правило третей, центральная композиция, ведущие линии
Стиль и эстетика
Лучше описывать стиль через технику и характеристики, чем через имена авторов или брендов. Технические термины более универсальны и предсказуемы:
- «Акварельная иллюстрация с мягкими переходами цвета»
- «Изометрическая 3D-графика, плоские тени, ограниченная палитра»
- «Кинематографическая фотография, тёплая палитра, лёгкое зерно»
- «Технический чертёж, тонкие линии, монохром»
Если нужно передать конкретное настроение — описывайте его прилагательными: «уютный», «строгий», «динамичный», «созерцательный». Эти слова модели понимают не хуже, чем технические термины.
Работа с референсами
Референсные изображения — это короткий путь к нужному результату, когда словами описать сложно. Несколько практических правил:
- 1 референс — для удержания одного аспекта: композиции, цвета или персонажа.
- 2–4 референса — для серии связанных кадров с единым стилем.
- 5–10 референсов — для тонкой настройки эстетики, когда важно усреднение характера.
- Не смешивайте принципиально разные стили. Если на одном референсе минимализм, а на другом — барочная детализация, модель усреднит до посредственного результата.
Негативы и исключения
Не все модели одинаково хорошо понимают инструкции «не делать». Поэтому формулируйте требования через утверждения:
- Вместо «без людей» — «пустое пространство»
- Вместо «не размытый» — «резкое изображение, высокая детализация»
- Вместо «не яркий» — «приглушённая цветовая палитра»
Шаблоны для разных задач
Продуктовый кадр для e-commerce
[Продукт] на [нейтральном/контрастном] фоне, [студийное/естественное] освещение [с конкретной стороны]. Чистая композиция, минимум отвлекающих элементов, акцент на материал и текстуру. Реалистичная фотография, объектив 50мм, f/8, разрешение 4K. Иллюстрация для статьи
Концептуальная иллюстрация на тему [тема статьи]. [Стиль: плоская графика / акварель / гравюра]. Ограниченная палитра из [3–4 цветов]. Композиция в центре, простой фон. Соотношение 16:9. Изображение для социальных сетей
[Сцена/субъект]. Современная цифровая фотография, выраженный характер, контрастное освещение. Соотношение 4:5 для ленты. Композиция с воздухом сверху для текста. Кадр для презентации
[Метафора/образ темы], минималистичный визуальный язык, нейтральная палитра, единый стилевой ряд для серии слайдов. Соотношение 16:9, свободное пространство в правой части кадра. Итеративная работа
Получить идеальный результат с первого раза — скорее исключение, чем правило. Работайте итерациями:
- Сделайте 3–4 черновых запроса с разными формулировками
- Выберите самый близкий к нужному результату
- Уточните детали в следующем запросе, добавьте референс
- Зафиксируйте удачный промпт как шаблон, чтобы не собирать его заново
В сервисе вся история промптов сохраняется. Это позволяет возвращаться к удачным формулировкам и использовать их как точку отсчёта для новых задач.