Kling 3.0 специально заточен под понимание кинематографического замысла, а не просто под описание картинки. Модель выдаёт заметно лучшие результаты, когда промпт написан как режиссёрская инструкция к сцене, а не как список объектов. Чёткая структура, явное указание движения и использование правильной съёмочной терминологии — ключ к качеству.
Ключевые особенности Kling 3.0
Думай кадрами, а не одним клипом
Одно из главных улучшений в Kling 3.0 — это встроенная генерация многосегментных видео (multi-shot), до шести кадров в одном клипе. Лучше всего сразу структурировать промпт как последовательность отдельных кадров, а не пытаться уместить всё в один абзац.
Для многосегментных промптов чётко помечай кадры и описывай для каждого композицию, главного героя и движение. Модель отлично понимает термины вроде profile shot, macro close-up, tracking shot, POV, shot-reverse-shot и диалоговые развороты. Это позволяет автоматически менять ракурсы и сохранять повествовательную целостность.
Хорошо структурированные промпты дают плавные переходы, разнообразие планов и осмысленный кинематографический ритм.
Закрепляй персонажей в начале для сохранения консистентности
Kling 3.0 значительно улучшил стабильность персонажей и объектов. Чтобы это использовать на полную, опиши ключевых героев максимально чётко в самом начале промпта и сохраняй одинаковое описание на протяжении всего текста.
Независимо от того, используешь ты только текст, референсное изображение или image-to-video — модель хорошо фиксирует черты лица, одежду, предметы и окружение. После этого элементы остаются стабильными даже при смене ракурсов и развитии сцены. Это особенно важно для историй с несколькими героями и многосегментными видео.
Пример промпта:
A dim kitchen late at night. Only the refrigerator hum fills the silence. A plate is set down too hard. Ceramic clinks sharply.
[Character A: Exhausted Partner, trembling frustrated voice ]: “You never listen to me.”
Immediately, the other partner turns around, eyes wide.
[Character B: Defensive Partner, shouting loudly ]: “Because you never stop blaming!”
The exhausted partner exhales shakily.
[Exhausted Partner, voice cracking ]: “I’m not blaming… I’m begging.”
Silence. The defensive partner sighs heavily.
[Defensive Partner, softly, regretful ]: “I don’t know how to fix this.”
A sad piano chord enters quietly.
Как видно, раннее введение персонажей помогает модели понять, кто именно говорит. Жирным выделены указания интонации — это сильно улучшает реалистичность диалогов.
Описывай движение максимально конкретно
Kling 3.0 очень хорошо реагирует на явные инструкции по движению — как персонажей, так и камеры.
Избегай расплывчатых формулировок. Пиши, как именно движется камера со временем: tracking, following, freezing, panning, движение в унисон с героем и т.д. Особенно круто получаются длинные планы (long takes), если чётко указано отношение камеры к объекту: держит medium shot, замирает, когда герой останавливается, плавно возобновляет движение.
Чёткие описания движения уменьшают артефакты, улучшают темп и делают сцену более естественной, особенно в динамичных или непрерывных эпизодах.
Используй встроенный звук осознанно
Kling 3.0 умеет генерировать нативный звук — диалоги, фоновые шумы, контролируемую интонацию голоса. Когда аудио включено, в промпте нужно явно указывать, кто говорит и в какой момент, особенно в сценах с несколькими персонажами.
Модель точно привязывает реплики к конкретным героям, понимает несколько языков, диалекты, акценты и даже переключение языков внутри одной сцены. При хорошем промпте синхронизация губ, мимика и тайминг голоса получаются очень естественными.
Пример промпта:
A sleek modern interrogation room with cold LED lighting. Muted gray walls, a glass window, security cameras blinking red. Low atmospheric suspense music hums with deep bass drones. A detective in a navy suit leans forward slowly.
His hands rest calmly on the table.
[ Character A: Lead Detective, controlled serious voice ] : “Let’s stop pretending.”
Immediately, the suspect shifts in their chair, tense.
[ Character B: Prime Suspect, sharp defensive voice ] : “I already told you everything.”
The detective slides a folder across the table. Paper scraping sound.
[Lead Detective, calm but threatening tone]: “Then explain why your fingerprints are here.”
The detective stands suddenly, chair scraping back. Music tightens with a rising pulse.
Опять же: сначала закрепляй персонажей, потом чётко разделяй диалоги. Ключевые слова с темпом и эмоцией сильно поднимают качество.
Модель очень хорошо понимает язык кино — сценное покрытие, композицию, ритм, непрерывность. Промпты в стиле «что зритель должен увидеть и почувствовать» почти всегда побеждают простые описания внешнего вида.
Используй длительности по максимуму
Kling 3.0 поддерживает видео до 15 секунд — это позволяет разворачивать настоящую мини-историю в одном клипе: многоактные действия, развитие эмоций, плавные переходы без склеек.
Длинные видео лучше всего получаются, когда промпт описывает развитие во времени: как действие разворачивается, как реагирует камера, как происходят переходы. Именно здесь Kling 3.0 сильно отрывается от предыдущих версий, позволяя снимать непрерывное повествование.
Пример:
Master Prompt: Joker begins his iconic dance descent down the stairs, arms outstretched, pure chaotic joy.
Multi shot Prompt 1: Man in red suit starts dancing at top of stairs, taking first exaggerated steps down, arms spreading wide, head tilting back in ecstasy, cigarette smoke trailing (Duration: 5 seconds)
Multi shot Prompt 2: Continuing wild dance down concrete steps, spinning and kicking, coat flapping dramatically, pure liberation and madness, reaching the bottom with triumphant pose (Duration: 5 seconds)
Image-to-Video: сначала фиксируй, потом двигай
При работе в режиме image-to-video относись к исходной картинке как к якорю. Kling 3.0 отлично сохраняет личность, расположение объектов, текст и детали, добавляя движение и глубину.
В промпте акцентируй, как именно сцена развивается из этой картинки: лёгкие движения, работа камеры, изменения окружения. Модель сохраняет надписи, логотипы и мелкие детали — это идеально для рекламы, брендового контента и реалистичных продолжений сцен.
Краткие правила для диалогов с несколькими персонажами
Используй уникальные и постоянные метки персонажей (никаких местоимений или синонимов).
Сначала описывай действие персонажа, потом его реплику.
Давай каждому голосу уникальную интонацию и эмоцию.
Используй слова-связки для контроля последовательности («immediately», «pause», «this is when…» и т.п.).
Примеры промптов с диалогами:
A busy kitchen in the morning. Cereal pouring. Coffee machine buzzing. Kids running footsteps. Backpack zippers. A mother flips toast quickly, stressed.
[Character A: Mom, fast urgent voice]: “Shoes on! We’re leaving in five minutes!”
Immediately, a little girl whines from the hallway.
[Character B: Little Daughter, crying voice]: “I can’t find my sweater!”
The older brother groans dramatically.
[Character C: Older Brother, annoyed sarcastic tone]: “Because you never put it away.”
Mom sighs heavily.
[Mom, shouting louder ]: “Nobody is fighting before 8 AM!”
[Driver Friend, softly speaking]: “That’s worse than yes.”
The passenger sighs deeply.
[Passenger Friend, tired voice]: “I just didn’t expect it from you.”
И еще:
A quiet park bench in the late afternoon. Birds chirping. Wind through trees. Soft acoustic guitar music. Two old friends sit side by side. One smiles softly.
[Character A: Old Friend 1, warm nostalgic voice]: “It’s been… what, ten years?”
Immediately, the other laughs quietly.
[Character B: Old Friend 2, emotional voice]: “Too long.”