Meta AI представляет MovieGen: новые продвинутые модели искусственного интеллекта для медиа.

 Meta AI Unveils MovieGen: A Series of New Advanced Media Foundation AI Models

Ключевые особенности MovieGen

Генерация видео высокого разрешения

Одной из важных особенностей MovieGen является возможность создания видеороликов длительностью 16 секунд с разрешением 1080p и частотой кадров 16 кадров в секунду, включая синхронизированный аудиофонд.

Синтез аудио

Помимо генерации видео, MovieGen внедряет модель синтеза аудио, способную генерировать кинематографическое звучание на уровне 48 кГц, синхронизированное с визуальным контентом и способное обрабатывать медиа разной длительности до 30 секунд.

Управление аудио контекстом

Способности генерации аудио MovieGen дополняются обучением с маскировкой предикции аудио, позволяющим модели эффективно обрабатывать различные аудио контексты, включая генерацию, расширение и восполнение.

Эффективное обучение и вывод

MovieGen использует цель соответствия потоку для эффективного обучения и вывода, с помощью архитектуры Diffusion Transformer.

Технические детали

Латентная диффузия с DAC-VAE

В основе аудиоспособностей MovieGen лежит использование латентной диффузии с DAC-VAE, обеспечивающее высококачественное аудио высокой четкости.

Улучшения DAC-VAE

Модель DAC-VAE включает в себя несколько улучшений, направленных на улучшение восстановления аудио при сжатых скоростях.

Приложения и влияние

Внедрение MovieGen представляет собой значительный скачок в технологии генерации медиа. Сочетая в себе генерацию видео высокого разрешения с передовым синтезом аудио, MovieGen позволяет создавать увлекательные и персонализированные медиа-опыты.

Заключение

MovieGen от Meta AI представляет собой гигантский прорыв в области генерации медиаконтента. Благодаря продвинутым моделям и инновационным техникам, он устанавливает новый стандарт возможностей в автоматизированном создании контента.

Полезные ссылки: