Структура промпта

Универсальная структура, которая работает для большинства задач: субъект → действие → окружение → стиль → технические параметры. Каждый блок отвечает на конкретный вопрос:

  • Субъект — кто или что в кадре
  • Действие — что происходит, в какой позе
  • Окружение — где это происходит, что вокруг
  • Стиль — фотореализм, иллюстрация, 3D, конкретная техника
  • Технические параметры — освещение, ракурс, объектив, цветовая палитра

Пример структурированного промпта:

Молодая женщина в белом халате врача, сидит за рабочим столом, держит планшет, изучает данные пациента. Современный медицинский кабинет с большими окнами, мягкое естественное освещение слева. Реалистичная фотография, объектив 50мм, глубина резкости f/2.8, нейтральная цветовая палитра.

Практические подсказки

Короткие ответы для частых ситуаций — что писать в промпте, а что лучше настраивать в параметрах запроса.

Если вы редактируете фото

Пишите не «сделай лучше», а что именно нужно поменять: «убери людей сзади», «замени фон на офис», «оставь лицо без изменений».

Если вы загрузили несколько референсов

Укажите, что брать из каждого: «возьми лицо с фото 1, одежду с фото 2, фон с фото 3».

Если вам нужен текст на картинке

Пишите точную фразу в кавычках и указывайте язык. Для текста на картинке лучше подходят Nano Banana 2, Nano Banana Pro и Qwen Image.

Если нужен прозрачный фон

Модели не умеют генерировать прозрачность напрямую. Попросите одноцветный фон — например, сплошной чёрный — а затем удалите его моделью Recraft Remove Background. Получите чистый PNG с прозрачностью.

Если хотите задать разрешение или формат

Не пишите в промпте «сделай в 4K» или «соотношение 3:2» — модель это проигнорирует. Разрешение и соотношение сторон выбираются в параметрах запроса перед генерацией.

Если результат вам не нравится

Меняйте по одному параметру за раз: сначала стиль, потом свет, потом ракурс. Иначе будет сложно понять, что именно улучшило картинку.

Что означают настройки

Кроме самого промпта, у каждой модели есть набор параметров, которые задаются до запуска. Это разрешение, соотношение сторон, тип выходного файла и ряд модель-специфичных опций. В промпте их прописывать не нужно — модель проигнорирует.

Разрешение: 1K, 2K, 4K

Разрешение отвечает за детализацию картинки.

  • 1K — быстрее и дешевле. Подходит для тестов, идей, соцсетей и быстрых черновиков.
  • 2K — золотая середина. Уже больше деталей, хороший вариант для большинства задач.
  • 4K — максимум качества, но обычно дороже и медленнее. Нужен для печати, баннеров, коммерческих макетов и сложных сцен.

Если не уверены, начните с 1K или 2K и повышайте разрешение, когда результат уже устраивает по содержанию.

Формат изображения

Формат здесь означает соотношение сторон, а не тип файла.

  • 1:1 — квадрат. Для аватарок, карточек и постов.
  • 4:5 — вертикальный пост для соцсетей.
  • 16:9 — широкий кадр: баннеры, презентации, обложки, видео-превью.
  • 9:16 — сторис, Reels, Shorts.
  • 3:4 и 4:3 — более классические пропорции фото.
  • 21:9 — ультраширокий кадр для кинокомпозиций и шапок.

Выбирайте формат сразу под задачу, чтобы потом не пришлось обрезать важные части изображения.

Популярные соотношения сторон изображений: 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
Подсказка по популярным соотношениям сторон.

Тип выходного файла

  • PNG — обычно тяжелее, но чище и лучше подходит для графики, текста, интерфейсов и ситуаций, где важна аккуратность.
  • JPG / JPEG — легче по весу, хорошо подходит для обычных фотографий и быстрых публикаций.
  • MP4 — используется у видеомоделей, если на выходе генерируется ролик, а не картинка.

Прозрачный фон ни одна модель напрямую не выдаёт. Если он нужен — сгенерируйте на одноцветном фоне и прогоните через Recraft Remove Background.

Дополнительные настройки

Эти параметры есть не у всех моделей — состав зависит от выбранной модели.

Качество (medium / high)

Доступно, например, у GPT Image. Medium — для быстрых итераций и черновиков, high — для финального материала. Влияет на стоимость генерации.

Длительность ролика

У видеомоделей задаётся отдельно. Kling — 5 или 10 секунд, Seedance — от 4 до 15 секунд, Grok Video — до 30 секунд. Чем длиннее ролик, тем выше стоимость.

Звук в видео

У Kling 2.6 включает синхронную генерацию речи, эффектов и фона — но дороже, чем без звука. У Seedance звук генерируется нативно вместе с кадром.

Режим (fun / normal / spicy)

У Grok Video управляет характером движения: fun — игровая интерпретация, normal — сбалансированная динамика, spicy — более интенсивное и выразительное движение. При работе с референсами spicy недоступен.

Google Search

Доступен у Nano Banana 2 и Seedance. Подгружает актуальную информацию из веба прямо в контекст запроса — полезно для генераций по свежим темам, событиям и реальным объектам.

NSFW Checker

Дополнительная проверка результата на чувствительный контент. Включайте, когда результат идёт в публичные каналы или в материалы для широкой аудитории.

Частые ошибки

Слишком короткий промпт

Запрос «красивый офис» оставляет модели полную свободу интерпретации, и результат будет случайным. Каждый раз другим. Минимально жизнеспособный промпт содержит хотя бы субъект, окружение и стиль.

Перегруженный промпт

Если запрос содержит десятки требований, модель начнёт игнорировать часть из них. Полезное правило: один запрос — одна сцена. Если нужно несколько связанных кадров, сделайте серию запросов с одинаковой структурой.

Противоречивые указания

«Минималистичная композиция с большим количеством деталей», «фотография в стиле акварели» — такие сочетания создают непредсказуемый результат. Лучше явно выбрать один подход и описать его подробно.

Композиция и кадр

Управление композицией — самый недооценённый рычаг в промптинге. Указывайте:

  • План: крупный, средний, общий
  • Ракурс: на уровне глаз, сверху, снизу, изометрия
  • Фокусное расстояние: 24мм для широких сцен, 50мм для естественной перспективы, 85мм+ для портретов
  • Глубину резкости: f/1.4 для сильного боке, f/8 для резкого общего плана
  • Композиционные приёмы: правило третей, центральная композиция, ведущие линии

Стиль и эстетика

Лучше описывать стиль через технику и характеристики, чем через имена авторов или брендов. Технические термины более универсальны и предсказуемы:

  • «Акварельная иллюстрация с мягкими переходами цвета»
  • «Изометрическая 3D-графика, плоские тени, ограниченная палитра»
  • «Кинематографическая фотография, тёплая палитра, лёгкое зерно»
  • «Технический чертёж, тонкие линии, монохром»

Если нужно передать конкретное настроение — описывайте его прилагательными: «уютный», «строгий», «динамичный», «созерцательный». Эти слова модели понимают не хуже, чем технические термины.

Работа с референсами

Референсные изображения — это короткий путь к нужному результату, когда словами описать сложно. Несколько практических правил:

  • 1 референс — для удержания одного аспекта: композиции, цвета или персонажа.
  • 2–4 референса — для серии связанных кадров с единым стилем.
  • 5–10 референсов — для тонкой настройки эстетики, когда важно усреднение характера.
  • Не смешивайте принципиально разные стили. Если на одном референсе минимализм, а на другом — барочная детализация, модель усреднит до посредственного результата.

Негативы и исключения

Не все модели одинаково хорошо понимают инструкции «не делать». Поэтому формулируйте требования через утверждения:

  • Вместо «без людей» — «пустое пространство»
  • Вместо «не размытый» — «резкое изображение, высокая детализация»
  • Вместо «не яркий» — «приглушённая цветовая палитра»

Шаблоны для разных задач

Продуктовый кадр для e-commerce

[Продукт] на [нейтральном/контрастном] фоне, [студийное/естественное] освещение [с конкретной стороны]. Чистая композиция, минимум отвлекающих элементов, акцент на материал и текстуру. Реалистичная фотография, объектив 50мм, f/8, разрешение 4K.

Иллюстрация для статьи

Концептуальная иллюстрация на тему [тема статьи]. [Стиль: плоская графика / акварель / гравюра]. Ограниченная палитра из [3–4 цветов]. Композиция в центре, простой фон. Соотношение 16:9.

Изображение для социальных сетей

[Сцена/субъект]. Современная цифровая фотография, выраженный характер, контрастное освещение. Соотношение 4:5 для ленты. Композиция с воздухом сверху для текста.

Кадр для презентации

[Метафора/образ темы], минималистичный визуальный язык, нейтральная палитра, единый стилевой ряд для серии слайдов. Соотношение 16:9, свободное пространство в правой части кадра.

Итеративная работа

Получить идеальный результат с первого раза — скорее исключение, чем правило. Работайте итерациями:

  1. Сделайте 3–4 черновых запроса с разными формулировками
  2. Выберите самый близкий к нужному результату
  3. Уточните детали в следующем запросе, добавьте референс
  4. Зафиксируйте удачный промпт как шаблон, чтобы не собирать его заново

В сервисе вся история промптов сохраняется. Это позволяет возвращаться к удачным формулировкам и использовать их как точку отсчёта для новых задач.