5 февраля 2026 года Kuaishou официально выпустила серию моделей Kling 3.0 (Video 3.0, Video 3.0 Omni, Image 3.0 и Image 3.0 Omni). Это не просто апдейт — это переход в эпоху «единого мультимодального движка», где ИИ впервые по-настоящему работает как режиссер: понимает сценарий, управляет камерой, персонажами, звуком и монтажом в одном проходе.
Вот что изменилось по сравнению с Kling 2.6 и почему многие уже называют 3.0 новым SOTA.
Примечание. В области машинного обучения SOTA — это передовая модель или алгоритм, который превосходит предыдущие подходы и достигает лучших результатов по точности, точности, recall и другим метрикам оценки.
- Длина видео до 15 секунд (гибко от 3 до 15 с) — в 1,5 раза больше, чем раньше. Достаточно для полноценной короткой сцены, диалога или мини-истории.
- Нативный аудио-генератор (самое большое улучшение):
– Мультиязычная речь (китайский, английский, японский, корейский, испанский + диалекты и акценты).
– До 3+ персонажей в одной сцене с правильной лип-синхронизацией и разными голосами.
– Можно задавать тон, эмоцию, порядок реплик — всё в одном промте.
- Multi-Shot + AI Director (новая фича):
– Автоматический или кастомный storyboard.
– ИИ сам планирует переходы, shot-reverse-shot, кросс-каты, движение камеры. – Custom Multi-Shot — задаешь количество шотов, их длительность и описание.
- Element Consistency 3.0 (улучшенная привязка персонажей и объектов):
– Загружаешь несколько фото/видео референсов — персонаж остается идентичным при любом движении камеры.
– Привязка голоса к конкретному персонажу.
– Сохранение текста на экране (вывески, субтитры, брендинг).
- Разрешение и качество: 1080p / 720p, заметно лучше физика (ткани, вода, волосы, гравитация), фотореализм и кинематографичность.