Эффективная оценка заполненности 3D пространства с помощью самообучаемого метода GaussianOcc

 GaussianOcc: A Self-Supervised Approach for Efficient 3D Occupancy Estimation Using Advanced Gaussian Splatting Techniques

“`html

GaussianOcc: самообучающий подход к эффективной оценке трехмерной занятости с использованием передовых методов гауссовского сплэттинга

Методы оценки трехмерной занятости в начале своего развития сильно полагались на обучение с учителем, требующее обширных 3D-аннотаций, что ограничивало масштабируемость. Появились методы самообучения и слабообученные техники, использующие объемную визуализацию с 2D сигналами наблюдения. Однако эти методы столкнулись с проблемами, включая необходимость наличия точных 6D поз и неэффективность процесса визуализации. Существующие наборы данных также имели ограничения, такие как самозаслонение, влияющее на точность прогнозирования.

Практические решения:

Для преодоления этих проблем исследователи исследовали более эффективные парадигмы для самообучения оценки трехмерной занятости. Они искали решения для уменьшения зависимости от точных поз, улучшения эффективности визуализации и разработки методов, применимых к реальным сценариям с ограниченной доступностью данных. В этой статье представлен GaussianOcc, полностью самообучающий подход с использованием гауссовского сплэттинга, разработанный для преодоления ограничений предыдущих методов и продвижения области оценки трехмерной занятости.

Основные компоненты:

GaussianOcc включает два ключевых компонента: гауссовский сплэттинг для проекции (GSP) и гауссовский сплэттинг из пространства вокселей (GSV). Эти инновации устраняют необходимость в точных позах во время обучения и повышают эффективность визуализации. Предложенный метод демонстрирует конкурентоспособную производительность, обеспечивая при этом в 2,7 раза быстрее обучение и в 5 раз быстрее визуализацию по сравнению с существующими подходами, что делает его высокоэффективным для практических применений в оценке трехмерной занятости.

Методология GaussianOcc:

Методология GaussianOcc сосредоточена на двух инновационных техниках: GSP и GSV. GSP обеспечивает точную информацию о масштабе во время обучения без зависимости от точных поз, используя проекции смежных видов для создания потерь между видами. Этот подход оптимизирует производительность модели и устраняет зависимость от внешних данных о позах. GSV повышает эффективность визуализации, выполняя гауссовский сплэттинг непосредственно из трехмерного воксельного пространства, рассматривая каждую вершину как 3D-гауссиан и оптимизируя атрибуты внутри воксельного пространства.

Преимущества GaussianOcc:

GaussianOcc демонстрирует превосходную производительность в оценке трехмерной занятости через самообучение и эффективную визуализацию. Метод превосходит существующие подходы в метриках занятости (mIoU) и оценке глубины. Модуль GSP обеспечивает получение точной информации о масштабе без точных поз. Стратегия обучения, учитывающая масштаб, включает техники маскирования и процессы улучшения для повышения эффективности гауссовского сплэттинга и улучшения точности оценки глубины. Комплексные исследования абляции оценивают влияние различных компонентов, демонстрируя преимущества предложенных методов в терминах метрик занятости и глубины. Этот интегрированный подход достигает эффективной и самообучающей оценки трехмерной занятости, преодолевая ключевые ограничения существующих методов.

Заключение:

GaussianOcc представляет собой полностью самообучающий и эффективный подход к оценке трехмерной занятости. Метод демонстрирует сильную обобщающую способность в различных средах, подтвержденную на наборах данных nuScenes и DDAD. Гауссовский сплэттинг в воксельных сетках превосходит традиционную объемную визуализацию по точности и эффективности, значительно снижая вычислительные затраты. Исследование подчеркивает важность точной оценки глубины при прогнозировании занятости. Инновационное использование сети 6D поз для самообучения, совместно с улучшениями визуализации, отмечает значительный прогресс в техниках понимания и восстановления трехмерных сцен.

Проверьте статью и репозиторий на GitHub. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Твиттер и присоединиться к нашему каналу в Телеграме и группе в LinkedIn. Если вам понравилась наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему сообществу 50k+ ML SubReddit.

Вот рекомендуемый вебинар от нашего спонсора: ‘Построение производительных приложений ИИ с использованием NVIDIA NIMs и Haystack’

Статья GaussianOcc: самообучающий подход к эффективной оценке трехмерной занятости с использованием передовых методов гауссовского сплэттинга была опубликована на MarkTechPost.

“`

Полезные ссылки: