Статьи / Обучение
Руководство по промптам для Kling 3.0
Kling 3.0 специально заточен под понимание кинематографического замысла, а не просто под описание картинки. Модель выдаёт заметно лучшие результаты, когда промпт написан как режиссёрская инструкция к сцене, а не как список объектов. Чёткая структура, явное указание движения и использование правильной съёмочной терминологии — ключ к качеству.

Ключевые особенности Kling 3.0

Думай кадрами, а не одним клипом

Одно из главных улучшений в Kling 3.0 — это встроенная генерация многосегментных видео (multi-shot), до шести кадров в одном клипе. Лучше всего сразу структурировать промпт как последовательность отдельных кадров, а не пытаться уместить всё в один абзац.

Для многосегментных промптов чётко помечай кадры и описывай для каждого композицию, главного героя и движение. Модель отлично понимает термины вроде profile shot, macro close-up, tracking shot, POV, shot-reverse-shot и диалоговые развороты. Это позволяет автоматически менять ракурсы и сохранять повествовательную целостность.

Хорошо структурированные промпты дают плавные переходы, разнообразие планов и осмысленный кинематографический ритм.

Закрепляй персонажей в начале для сохранения консистентности

Kling 3.0 значительно улучшил стабильность персонажей и объектов. Чтобы это использовать на полную, опиши ключевых героев максимально чётко в самом начале промпта и сохраняй одинаковое описание на протяжении всего текста.

Независимо от того, используешь ты только текст, референсное изображение или image-to-video — модель хорошо фиксирует черты лица, одежду, предметы и окружение. После этого элементы остаются стабильными даже при смене ракурсов и развитии сцены. Это особенно важно для историй с несколькими героями и многосегментными видео.
Пример промпта:

A dim kitchen late at night.
Only the refrigerator hum fills the silence.
A plate is set down too hard.
Ceramic clinks sharply.

[Character A: Exhausted Partner, trembling frustrated voice ]: “You never listen to me.”

Immediately, the other partner turns around, eyes wide.

[Character B: Defensive Partner, shouting loudly ]: “Because you never stop blaming!”

The exhausted partner exhales shakily.

[Exhausted Partner, voice cracking ]: “I’m not blaming… I’m begging.”

Silence.
The defensive partner sighs heavily.

[Defensive Partner, softly, regretful ]: “I don’t know how to fix this.”

A sad piano chord enters quietly.
Как видно, раннее введение персонажей помогает модели понять, кто именно говорит. Жирным выделены указания интонации — это сильно улучшает реалистичность диалогов.

Описывай движение максимально конкретно

Kling 3.0 очень хорошо реагирует на явные инструкции по движению — как персонажей, так и камеры.

Избегай расплывчатых формулировок. Пиши, как именно движется камера со временем: tracking, following, freezing, panning, движение в унисон с героем и т.д. Особенно круто получаются длинные планы (long takes), если чётко указано отношение камеры к объекту: держит medium shot, замирает, когда герой останавливается, плавно возобновляет движение.

Чёткие описания движения уменьшают артефакты, улучшают темп и делают сцену более естественной, особенно в динамичных или непрерывных эпизодах.

Используй встроенный звук осознанно

Kling 3.0 умеет генерировать нативный звук — диалоги, фоновые шумы, контролируемую интонацию голоса. Когда аудио включено, в промпте нужно явно указывать, кто говорит и в какой момент, особенно в сценах с несколькими персонажами.

Модель точно привязывает реплики к конкретным героям, понимает несколько языков, диалекты, акценты и даже переключение языков внутри одной сцены. При хорошем промпте синхронизация губ, мимика и тайминг голоса получаются очень естественными.
Пример промпта:

A sleek modern interrogation room with cold LED lighting.
Muted gray walls, a glass window, security cameras blinking red.
Low atmospheric suspense music hums with deep bass drones.
A detective in a navy suit leans forward slowly.

His hands rest calmly on the table.

[ Character A: Lead Detective, controlled serious voice ] : “Let’s stop pretending.”

Immediately, the suspect shifts in their chair, tense.

[ Character B: Prime Suspect, sharp defensive voice ] : “I already told you everything.”

The detective slides a folder across the table.
Paper scraping sound.

[Lead Detective, calm but threatening tone]: “Then explain why your fingerprints are here.”

The suspect’s breathing quickens.

[Prime Suspect, voice trembling]: “That’s impossible…”

The detective stands suddenly, chair scraping back.
Music tightens with a rising pulse.
Опять же: сначала закрепляй персонажей, потом чётко разделяй диалоги. Ключевые слова с темпом и эмоцией сильно поднимают качество.

Модель очень хорошо понимает язык кино — сценное покрытие, композицию, ритм, непрерывность. Промпты в стиле «что зритель должен увидеть и почувствовать» почти всегда побеждают простые описания внешнего вида.

Используй длительности по максимуму

Kling 3.0 поддерживает видео до 15 секунд — это позволяет разворачивать настоящую мини-историю в одном клипе: многоактные действия, развитие эмоций, плавные переходы без склеек.

Длинные видео лучше всего получаются, когда промпт описывает развитие во времени: как действие разворачивается, как реагирует камера, как происходят переходы. Именно здесь Kling 3.0 сильно отрывается от предыдущих версий, позволяя снимать непрерывное повествование.
Пример:

Master Prompt: Joker begins his iconic dance descent down the stairs, arms outstretched, pure chaotic joy.

Multi shot Prompt 1: Man in red suit starts dancing at top of stairs, taking first exaggerated steps down, arms spreading wide, head tilting back in ecstasy, cigarette smoke trailing (Duration: 5 seconds)

Multi shot Prompt 2: Continuing wild dance down concrete steps, spinning and kicking, coat flapping dramatically, pure liberation and madness, reaching the bottom with triumphant pose (Duration: 5 seconds)
Image-to-Video: сначала фиксируй, потом двигай

При работе в режиме image-to-video относись к исходной картинке как к якорю. Kling 3.0 отлично сохраняет личность, расположение объектов, текст и детали, добавляя движение и глубину.

В промпте акцентируй, как именно сцена развивается из этой картинки: лёгкие движения, работа камеры, изменения окружения. Модель сохраняет надписи, логотипы и мелкие детали — это идеально для рекламы, брендового контента и реалистичных продолжений сцен.

Краткие правила для диалогов с несколькими персонажами

  • Используй уникальные и постоянные метки персонажей (никаких местоимений или синонимов).
  • Сначала описывай действие персонажа, потом его реплику.
  • Давай каждому голосу уникальную интонацию и эмоцию.
  • Используй слова-связки для контроля последовательности («immediately», «pause», «this is when…» и т.п.).
Примеры промптов с диалогами:

A busy kitchen in the morning.
Cereal pouring. Coffee machine buzzing.
Kids running footsteps. Backpack zippers.
A mother flips toast quickly, stressed.

[Character A: Mom, fast urgent voice]: “Shoes on! We’re leaving in five minutes!”

Immediately, a little girl whines from the hallway.

[Character B: Little Daughter, crying voice]: “I can’t find my sweater!”

The older brother groans dramatically.

[Character C: Older Brother, annoyed sarcastic tone]: “Because you never put it away.”

Mom sighs heavily.

[Mom, shouting louder ]: “Nobody is fighting before 8 AM!”

The dad walks in calmly sipping coffee.

[Character D: Dad, sleepy amused voice ]: “Good morning, team.”

Mom turns sharply.

[Mom, exhausted voice]: “Help.”
Ещё один:

Inside a parked car at night.
Rain tapping softly on the roof.
Low lo-fi music playing from the speakers.
A driver grips the steering wheel, nervous.

[Character A: Driver Friend, hesitant voice]: “So… are you mad at me?”

Immediately, the passenger stares out the window.

[Character B: Passenger Friend, quiet cold tone]: “I don’t know.”

The driver swallows.

[Driver Friend, softly speaking]: “That’s worse than yes.”

The passenger sighs deeply.

[Passenger Friend, tired voice]: “I just didn’t expect it from you.”
И еще:

A quiet park bench in the late afternoon.
Birds chirping. Wind through trees.
Soft acoustic guitar music.
Two old friends sit side by side.
One smiles softly.

[Character A: Old Friend 1, warm nostalgic voice]: “It’s been… what, ten years?”

Immediately, the other laughs quietly.

[Character B: Old Friend 2, emotional voice]: “Too long.”

Pause.

[Old Friend 1, softly speaking]: “I missed you.”

The other nods slowly.

[Old Friend 2, whispering]: “Me too.”