Документ от Microsoft представляет SiMBA: упрощенную архитектуру на основе Mamba для обработки изображений и многомерных временных рядов.

 This AI Paper from Microsoft Present SiMBA: A Simplified Mamba-based Architecture for Vision and Multivariate Time Series

Приветствую!

Представляем вам SiMBA: прорыв в архитектуре искусственного интеллекта для анализа изображений и временных рядов.

Эволюция языковых моделей

Языковые модели развиваются от больших (LLM) к малым (SLM), с трансформерами в их основе. Однако сети внимания в трансформерах сталкиваются с проблемами, такими как низкий индуктивный уклон и квадратичная сложность для входных последовательностей.

Решение проблем с моделями пространства состояний

Модели пространства состояний (SSM), такие как S4 и Mamba, появились для обработки более длинных последовательностей, но сталкиваются с проблемами в информационно насыщенных областях, таких как компьютерное зрение, и дискретных сценариях, таких как геномные данные.

Прорыв: архитектура SiMBA

SiMBA, разработанный исследователями из Microsoft, включает Mamba для моделирования последовательностей и представляет собой Einstein FFT (EinFFT) для моделирования каналов. Он эффективно решает проблемы нестабильности, наблюдаемые в Mamba, демонстрируя превосходную производительность по нескольким метрикам оценки.

Ключевые компоненты SiMBA

Компонент Channel Mixing SiMBA включает в себя Spectral Transformation, Spectral Gating Network с использованием умножения матрицы Эйнштейна и Inverse Spectral Transformation. EinFFT использует канальное смешивание в частотной области для извлечения важных шаблонов данных с улучшенной глобальной видимостью и концентрацией энергии.

Практические применения и производительность

SiMBA демонстрирует выдающуюся производительность в обработке разнообразных задач прогнозирования временных рядов и модальностей, превосходя современные модели. Он также показывает исключительную производительность на наборе данных ImageNet 1K, превосходя ведущие сверточные сети и трансформеры.

Выводы и вклад

Основные вклады исследователей включают EinFFT как новую технику моделирования каналов, оптимизированную архитектуру Mamba в SiMBA и заполнение пробела в производительности по сравнению с современными трансформерами на основе внимания. SiMBA представляет собой значительное достижение в архитектуре искусственного интеллекта для анализа изображений и временных рядов.

Практические решения искусственного интеллекта для вашего бизнеса

Узнайте, как искусственный интеллект может переопределить ваши процессы продаж и взаимодействия с клиентами с помощью AI Sales Bot от itinai.com/aisalesbot, разработанного для автоматизации взаимодействия с клиентами 24/7 и управления взаимодействиями на всех этапах путешествия клиента.

Для советов по управлению KPI и понимания применения искусственного интеллекта свяжитесь с нами по адресу hello@itinai.com и следите за нашими новостями в Telegram t.me/itinainews или Twitter @itinaicom.

Список полезных ссылок:

AI Lab в Telegram @aiscrumbot – бесплатная консультация

Эта статья от Microsoft представляет SiMBA: упрощенную архитектуру на основе Mamba для анализа изображений и многомерных временных рядов

MarkTechPost

Twitter – @itinaicom

Полезные ссылки: