Статья о ИИ из Китая предлагает новую архитектуру под названием ViTAR (Vision Transformer with Any Resolution).

 This AI Paper from China Proposes a Novel Architecture Named-ViTAR (Vision Transformer with Any Resolution)

“Мощь видео-трансформеров в решениях искусственного интеллекта

Преобразование визуальных задач с помощью видео-трансформеров (ViTs)

Архитектура Vision Transformer (ViT), основанная на модели Transformer, показала выдающийся успех в визуальных задачах, таких как классификация изображений, обнаружение объектов и распознавание видео. Однако ViTs сталкиваются с вызовами в обработке вариативных входных разрешений.

Решение вызовов с помощью ViTAR

В ответ на эти вызовы команда из Китая предложила новаторское решение под названием Vision Transformer with Any Resolution (ViTAR). ViTAR разработан для эффективной обработки изображений с высоким разрешением, сохраняя при этом обобщенные возможности разрешения.

Основные особенности ViTAR

ViTAR вводит модуль Adaptive Token Merger (ATM), который эффективно объединяет токены в фиксированную сетку, улучшая адаптируемость разрешения и минимизируя вычислительную сложность. Кроме того, Fuzzy Positional Encoding (FPE) обеспечивает обобщение до произвольных разрешений путем введения позиционного возмущения для предотвращения переобучения и улучшения адаптируемости.

Подтверждение и производительность

Обширные эксперименты подтвердили эффективность ViTAR, демонстрируя надежные результаты при различных входных разрешениях и выдающуюся производительность по сравнению с существующими моделями ViT. ViTAR также проявляет замечательные результаты в последующих задачах, таких как сегментация экземпляров и семантическая сегментация.

Применение практических решений искусственного интеллекта

Желаете развивать свою компанию с помощью искусственного интеллекта и оставаться конкурентоспособными? Узнайте, как искусственный интеллект может изменить ваш способ работы, используя практические решения искусственного интеллекта, такие как ViTAR и AI Sales Bot от itinai.com/aisalesbot.

Руководство по внедрению искусственного интеллекта

Если вы рассматриваете внедрение искусственного интеллекта, следуйте этим шагам: определите возможности автоматизации, определите ключевые показатели производительности, выберите решение искусственного интеллекта, соответствующее вашим потребностям, и внедряйте постепенно. Свяжитесь с нами по адресу hello@itinai.com для консультаций по управлению KPI искусственным интеллектом и следите за нашими новостями на Telegram t.me/itinainews или Twitter @itinaicom для постоянных идей по использованию искусственного интеллекта.

Список полезных ссылок:

AI Lab в Telegram @aiscrumbot – бесплатная консультация

Эта статья из Китая предлагает новую архитектуру под названием ViTAR (Vision Transformer with Any Resolution)

MarkTechPost

Twitter – @itinaicom”

Полезные ссылки: