Присоединяйтесь к нашим ежедневным и еженедельным информационным бюллетеням для последних обновлений и эксклюзивного контента в лидирующем отраслевом освещении искусственного интеллекта. Узнать больше
Runway Ai Inc. сегодня запустила свою наиболее продвинутую модель генерации видео с ИИ, введя следующий этап конкуренции для создания инструментов, которые могут преобразовать производство фильмов. Новая система Gen-4 вводит консистенцию персонажа и сцены на нескольких снимках-способность, которая до сих пор уклонялась от большинства видео генераторов искусственного интеллекта.
Нью-Йоркский стартап, поддерживаемый Google, Nvidia и Salesforce, выпускает «Gen-4» для всех платных подписчиков и корпоративных клиентов, с дополнительными функциями, запланированными напоследствии на этой неделе. Пользователи могут генерировать пять и десять секундных клипов с разрешением 720p.
Выпуск поступает через несколько дней после того, как Openai выпустила новую функцию генерации изображений, которая также обеспечивает согласованность символов на его изображениях. Релиз создал культурное явление: миллионы пользователей, запрашивающих студийные изображения в стиле Ghibli через CHATGPT. Отчасти это была последовательность стиля Гибли в чатах, которые создали фурур.
Вирусная тенденция стала настолько популярной, что временно разбила серверы Openai, когда генеральный директор Сэм Альтман написал в Твиттере, что «наши графические процессоры тают» из -за беспрецедентного спроса. Изображения в стиле Ghibli также вызвали жаркие дебаты об авторском праве, причем многие вопросы спрашивают, могут ли компании по искусству имитировать характерные художественные стили.
Визуальная непрерывность: недостающая пьеса в кинопроизводстве AI до сих пор
Так что, если консистенция персонажа привела к огромному вирусному росту для функции изображения Openai, может ли то же самое произойти для взлетно -посадочной полосы в видео?
Персонаж и последовательность сцены — поддержание одних и тех же визуальных элементов по нескольким снимкам и углам — была ахиллесовой пятой генерации видео. Когда лицо персонажа тонко изменяется между разрезами или фоновым элементом, исчезает без объяснения, искусственная природа контента становится сразу очевидна для зрителей.
Задача основана на том, как эти модели работают на фундаментальном уровне. Предыдущие генераторы ИИ рассматривали каждую кадр как отдельную творческую задачу, и между ними только свободные соединения. Представьте, что вы просите комнату, полную художников, на каждом рисовании одного кадра фильма, не видя того, что произошло до или после — результат был бы визуально разрознен.
Gen-4 от взлетно-посадочной полосы решил эту проблему, создав то, что составляет постоянную память о визуальных элементах. Как только характер, объект или среда установлена, система может сделать его с разных сторон, сохраняя при этом свои основные атрибуты. Это не просто техническое улучшение; Это разница между созданием интересных визуальных фрагментов и рассказыванием реальных историй.
Использование визуальных ссылок, в сочетании с инструкциями, Gen-4 позволяет создавать новые изображения и видео с последовательными стилями, предметами, местоположениями и многим другим. Разрешение на преемственность и контроль в ваших историях.
— ВПП (@runwayml) 31 марта 2025 года
Чтобы проверить повествовательные возможности модели, мы собрали… pic.twitter.com/iyz2baew2u
Согласно документации по ВПП, Gen-4 позволяет пользователям предоставлять эталонные изображения субъектов и описывать желаемую композицию, с помощью AI, генерирующих последовательные выходы с разных сторон. Компания утверждает, что модель может представлять видео с реалистичным движением, сохраняя при этом субъект, объект и последовательность стиля.
Чтобы продемонстрировать возможности модели, взлетно-посадочная полоса выпустила несколько короткометражных фильмов, полностью созданных с Gen-4. Один фильм «Нью -Йорк — это зоопарк», демонстрирует визуальные эффекты модели, размещая реалистичных животных в кинематографических нью -йоркских условиях. Другой под названием «Поиск» следует за исследователями, которые ищут таинственный цветок, и был произведен менее чем за неделю.
От анимации лица до мировых моделей: эволюция кинопроизводства взлетно -посадочной полосы
Gen-4 основан на предыдущих инструментах взлетно-посадочной полосы. В октябре компания выпустила Act-One, функцию, которая позволяет кинематографистам собирать выражения лица из видео смартфона и передавать их персонажам, сгенерированным AI. В следующем месяце взлетно-посадочная полоса добавила расширенную 3D-подобную управление камерой в свою модель Alpha Turbo Gen-3, позволяя пользователям увеличивать и выходить из сцен при сохранении форм символов.
Эта траектория раскрывает стратегическое видение взлетно -посадочной полосы. В то время как конкуренты сосредоточены на создании еще более реалистичных отдельных изображений или клипов, взлетно -посадочная полоса собирает компоненты полного цифрового производственного конвейера. Этот подход больше похож на то, как работают реальные режиссеры — решают проблемы производительности, освещения и визуальной непрерывности как взаимосвязанных задач, а не изолированных технических препятствий.
Эволюция от инструментов анимации лица до последовательных мировых моделей предполагает, что взлетно-посадочная полоса понимает, что A-A-Assisted Cilmaking необходимо следовать логике традиционного производства, чтобы быть по-настоящему полезным. Это разница между созданием технической демонстрации и создания профессионалов, которые профессионалы могут фактически включить в свои рабочие процессы.
Битва на миллиард долларов в области миллиарда долларов
Финансовые последствия являются существенными для взлетно -посадочной полосы, которая, как сообщается, поднимает новый раунд финансирования, который будет оценить компанию в 4 миллиарда долларов. Согласно Financial Reports, стартап направлен на то, чтобы достичь годового дохода в 300 миллионов долларов в этом году после запуска новых продуктов и API для его моделей, генерирующих видео.
Взлетно -посадочная полоса продолжала голливудские партнерские отношения, заключив сделку с Lionsgate по созданию пользовательской модели генерации видео с ИИ, основанной на каталоге студии более 20 000 названий. Компания также создала фонд «Сто», предлагая режиссерам до 1 миллиона долларов для производства фильмов с использованием ИИ.
«Мы считаем, что лучшие истории еще предстоит рассказать, но что традиционные механизмы финансирования часто упускают из виду новые и новые видения в более крупной отраслевой экосистеме», — объясняет Рунлей на веб -сайте своего фонда.
Тем не менее, технология вызывает обеспокоенность для профессионалов киноиндустрии. Исследование 2024 года, проведенное по заказу Гильдии анимации, показало, что 75% кинопроизводственных компаний, которые приняли ИИ, сократили, консолидировали или устраняли рабочие места. Исследовательские проекты, которые к 2026 году будут повлиять на исследовательские проекты, в которых более 100 000 рабочих мест для развлечений в США будут затронуты.
Вопросы об авторском праве следуют за творческим взрывом ИИ
Как и другие компании искусственного интеллекта, взлетно -посадочная полоса сталкивается с юридическим контролем по поводу своих данных обучения. В настоящее время компания защищается в судебном процессе, представленном художниками, которые утверждают, что их работа, защищенные авторским правом, использовалась для обучения моделей ИИ без разрешения. Взлетно -посадочная полоса привела доктрину справедливого использования в качестве своей защиты, хотя суды еще не должны окончательно управлять этим применением закона об авторском праве.
Дебаты об авторском праве усилились на прошлой неделе с функцией Studio Ghibli от Openai, которая позволила пользователям генерировать изображения в отличительном стиле анимационной студии Хаяо Миядзаки без явного разрешения. В отличие от Openai, который отказывается генерировать изображения в стиле живых артистов, но позволяет студийным стилям, взлетно -посадочная полоса не подробно описала свою политику по мимике стиля.
Это различие кажется все более произвольным, поскольку модели ИИ становятся более сложными. Граница между обучением на широких художественных традициях и копированием стилей конкретных создателей размыта до почти невидимости. Когда ИИ может идеально имитировать визуальный язык, которому Miyazaki за десятилетия развивались, имеет ли значение, просим ли мы его скопировать студию или самого художника?
При вопрос об обучении источников данных взлетно -посадочная полоса отказалась предоставить специфику, ссылаясь на конкурентные проблемы. Эта непрозрачность стала стандартной практикой среди разработчиков искусственного интеллекта, но она остается представленной для создателей.
Инструменты здесь, но какие истории мы расскажем?
Как маркетинговые агентства, создатели образовательного контента и группы по корпоративным коммуникациям изучают, как такие инструменты, как Gen-4, могут упростить производство видео, вопрос переходит от технических возможностей к творческому применению.
Для кинематографистов технология представляет собой как возможность, так и разрушение. Независимые создатели получают доступ к возможностям визуальных эффектов, ранее доступных только для крупных студий, в то время как традиционные VFX и специалисты по анимации сталкиваются с неопределенным будущим.
Неудобная правда заключается в том, что технические ограничения никогда не были тем, что мешает большинству людей снимать убедительные фильмы. Способность поддерживать визуальную непрерывность не создаст поколения гений рассказывания историй. Однако он может сделать достаточно трения из процесса, что все больше людей могут экспериментировать с визуальным повествованием, не требуя специализированного обучения или дорогого оборудования.
Возможно, самый глубокий аспект Gen-4-это не то, что он может создать, но о том, что он предлагает в наших отношениях с визуальными медиа-медиами. Мы вступаем в эпоху, когда узкое место в производстве не технические навыки или бюджет, а воображение и цель. В мире, где кто -то может создать любое изображение, которое они могут описать, важный вопрос стал: что стоит показать?
Когда мы вводим эпоху, когда создание фильма требует чуть больше, чем справочное изображение и подсказку, самый насущный вопрос не заключается в том, может ли ИИ снимать убедительные видео, а можем ли мы найти что -то значимое, когда инструменты, чтобы сказать что -либо, у нас под рукой.
Источник
