Генерация реалистичного взаимодействия человека с объектами в 3D при помощи текстовых описаний и моделей диффузии: новый подход AI

Itinai.com it company office background blured photography by 2f4c6499 6d9f 413b 8dd8 10c4ad53e96c 1

«`html

Улучшение 3D генерации с помощью DreamHOI

Ранее методы генерации 3D моделей сосредотачивались на использовании моделей, специфичных для категорий, и работе с одним изображением. Недавние достижения включают использование предварительно обученных генераторов изображений и видео, особенно моделей диффузии, для создания моделей в открытом домене. Тонкая настройка на многовидовых наборах данных улучшила результаты, но остались вызовы в создании сложных композиций и взаимодействий. Попытки улучшить композициональность в моделях генерации изображений столкнулись с трудностями в передаче техник на генерацию 3D моделей. Некоторые методы расширили подходы к дистилляции для композиционной генерации 3D моделей, оптимизируя отдельные объекты и пространственные отношения, соблюдая физические ограничения.

Синтез взаимодействия человек-объект

Методы, такие как InterFusion, развивают синтез взаимодействия на основе текстовых подсказок. Однако ограничения в управлении идентичностью человека и объекта остаются. Многие подходы сталкиваются с проблемой сохранения идентичности и структуры человеческой сетки во время генерации взаимодействия. Эти вызовы подчеркивают необходимость более эффективных техник, позволяющих больший контроль пользователю и практическую интеграцию в производственные процессы виртуальной среды.

Революционный подход DreamHOI

Исследователи из Университета Оксфорда и Университета Карнеги-Меллона представили метод нулевой настройки для синтеза 3D взаимодействия человек-объект с использованием текстовых описаний. Подход использует модели диффузии текста в изображение для решения вызовов, связанных с разнообразной геометрией объектов и ограниченными наборами данных. Он оптимизирует артикуляцию человеческой сетки с помощью градиентов выборочной дистилляции из этих моделей. Метод использует двойное неявно-явное представление, объединяя нейронные радиационные поля с артикуляцией сетки, управляемой скелетом, для сохранения идентичности персонажа. Этот инновационный подход позволяет создавать реалистичные взаимодействия человека с объектами без обширного сбора данных, продвигая область синтеза 3D взаимодействия.

Превосходство DreamHOI

Метод DreamHOI превосходит базовые методы с более высокими оценками сходства CLIP. Его двойное неявно-явное представление объединяет нейронные радиационные поля и артикуляцию сетки, позволяя гибкую оптимизацию позы, сохраняя при этом идентичность персонажа. Двухэтапный процесс оптимизации, включающий 5000 шагов улучшения NeRF, способствует высококачественным результатам. Регуляризаторы играют важную роль в поддержании правильного размера и выравнивания модели. Регрессор облегчает переходы между NeRF и сетчатыми представлениями. DreamHOI преодолевает ограничения методов, таких как DreamFusion, в поддержании идентичности и структуры сетки.

Выводы

Метод DreamHOI представляет новаторский подход для создания реалистичных взаимодействий человека с объектами в 3D с использованием текстовых описаний и моделей диффузии. Экспериментальные результаты демонстрируют превосходство DreamHOI по сравнению с базовыми методами, а абляционные исследования подтверждают важность каждого компонента. Этот прогресс открывает новые возможности для применения в индустрии развлечений и не только.

Подробнее об исследовании читайте на странице Paper and Project Page.

Авторы исследования: Researchers of this project.

Следите за нашими новостями в Twitter и присоединяйтесь к нашим группам в Telegram и LinkedIn.

Присоединяйтесь к нашему сообществу в ML SubReddit.

Бесплатный вебинар: ‘SAM 2 for Video: How to Fine-tune On Your Data’ (ср, 25 сентября, 11:00 – 11:45 по МСК).

«`

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Сотрудничество

Бесплатный ИИ текст генератор

Спросить ИИ чат

Заказать разработку

18.09.2024

Владимир Дьячков PhD

Лучшие ИИ

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

29.03.2024

Лучшие ИИ

Alibaba released a small MoE model, Qwen1.5-MoE-A2.7B, with only 2.7B activated parameters. Despite its size, it matches the performance of larger 7B models like Mistral 7B.

AI tools, AI Новости, Innovation, LLM, ИИ
06.05.2025

Готовые ИТ решения

Система управления заявками с ИИ-классификацией и автоматизацией решения

Сколько стоит Система управления заявками с ИИ-классификацией и автоматизацией решения: самостоятельный путь vs готовое решение от itinai.ru? В современном бизнесе скорость обработки обращений клиентов – это не просто…
25.09.2024

Лучшие ИИ

Minish Lab выпустил Model2Vec: Искусственный интеллект для создания компактных и быстрых моделей из любого предложения-трансформера.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
09.01.2025

Лучшие ИИ

TabTreeFormer: Улучшение генерации синтетических табличных данных с помощью деревьев решений и двойной квантования токенов

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
01.06.2025

Лучшие ИИ

Эффективное управление файлами и процессами с Desktop Commander MCP Server

Введение В современном мире автоматизация бизнес-процессов становится неотъемлемой частью успешного ведения дел. Одним из мощных инструментов, который может значительно упростить вашу работу, является Desktop Commander MCP Server. Этот…
14.05.2025

ИИ онлайн решения

Интеграция IoT и компьютерного зрения для контроля качества в производстве

Техническая актуальность Интеграция IoT и компьютерного зрения от компании CB Technologies представляет собой важный шаг в эволюции производственных процессов. В условиях современного рынка, где конкуренция становится все более…
31.03.2025

КП

Преимущества AI-решений для бизнеса «Скобеев и Партнеры»

Преимущества сотрудничества с «Скобеев и Партнеры» в сфере AI-решений В современном мире маркетинга, где конкуренция достигает новых высот, важно находить инновационные решения для улучшения бизнес-процессов и увеличения прибыли.…
08.10.2024

Лучшие ИИ

Новый подход к улучшению эффективности моделей трансформера: внимание с выборочной активацией.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

Генерация реалистичного взаимодействия человека с объектами в 3D при помощи текстовых описаний и моделей диффузии: новый подход AI

Улучшение 3D генерации с помощью DreamHOI

Синтез взаимодействия человек-объект

Революционный подход DreamHOI

Превосходство DreamHOI

Выводы

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

Монетизация AI в нише репетиторства по английскому

AI-бот в канале про финансы и инвестиции

Как зарабатывать на AI в нише психологии

Монетизация блога про уход за кожей

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Агент по автоматизации юридических процессов : подготовка шаблонных документов

ИИ-Аналитик документов : извлечение данных из контрактов и отчетов

ИИ-Аналитик конкурентов : мониторинг цен и позиционирования

ИИ-Специалист по автоматизации технической поддержки : диагностика и решение проблем

Как разработать тест по завершению курса: ИИ создаст 10 вопросов с вариантами и правильными ответами

Что писать в follow-up после звонка: искусственный интеллект создаст текст письма с повторным касанием

Как настроить CJM для новой целевой аудитории: ИИ разложит этапы и боли по шаблону

Как ответить на “дорого”: искусственный интеллект предложит 3 стратегии отработки возражения

Как администратору магазина вести график смен персонала без Excel: искусственный интеллект составит таблицу с учетом загрузки

Как адаптировать ИТ-обучение для немассовых пользователей: ИИ предложит текст и формат “просто о сложном”

Лучший ИИ онлайн

Alibaba released a small MoE model, Qwen1.5-MoE-A2.7B, with only 2.7B activated parameters. Despite its size, it matches the performance of larger 7B models like Mistral 7B.

Система управления заявками с ИИ-классификацией и автоматизацией решения

Minish Lab выпустил Model2Vec: Искусственный интеллект для создания компактных и быстрых моделей из любого предложения-трансформера.

TabTreeFormer: Улучшение генерации синтетических табличных данных с помощью деревьев решений и двойной квантования токенов

Эффективное управление файлами и процессами с Desktop Commander MCP Server

Интеграция IoT и компьютерного зрения для контроля качества в производстве

Преимущества AI-решений для бизнеса «Скобеев и Партнеры»

Новый подход к улучшению эффективности моделей трансформера: внимание с выборочной активацией.

Контакты

Доступность

Партнеры

Реклама

Куки-политика

Политика конфиденциальности