Nexa AI представила OmniVision-968M: самый маленький языковой модель для зрения с уменьшением токенов в 9 раз для устройств на краю.

 Nexa AI Releases OmniVision-968M: World’s Smallest Vision Language Model with 9x Tokens Reduction for Edge Devices

“`html

Искусственный интеллект на краю: решение Nexa AI

Искусственный интеллект (ИИ) на краю долгое время сталкивался с проблемами эффективности. Разработка моделей Vision Language (VLM) для устройств на краю сложна из-за их большого размера и высоких вычислительных требований. Модели, созданные для облака, не всегда подходят для устройств с ограниченными ресурсами, что приводит к проблемам, таким как высокое потребление энергии и медленные ответы.

Проблемы и спрос на легкие модели

С ростом применения дополненной реальности, умных домашних помощников и промышленного Интернета вещей растет необходимость в легких и эффективных моделях. Это особенно важно для быстрого обработки визуальных и текстовых данных. Проблемы усиливаются из-за высокой частоты ошибок и ненадежных результатов в задачах, где необходимы качество и точность.

Новый продукт: OmniVision-968M

Nexa AI представила OmniVision-968M – самую компактную модель VLM в мире с уменьшением числа токенов в 9 раз для устройств на краю. Эта модель оптимизирована по сравнению с LLaVA, обеспечивая новую степень компактности и эффективности.

Ключевые компоненты OmniVision-968M

  • Основная языковая модель: Qwen2.5-0.5B-Instruct для обработки текстовых данных.
  • Визуальный кодировщик: SigLIP-400M, который генерирует векторные представления изображений.
  • Слой проекции: Многослойный перцептрон (MLP) согласует векторные представления с языковой моделью.

Преимущества решения

Сокращение токенов с 729 до 81 значительно уменьшает вычислительные затраты и время отклика, что критично для устройств на краю. Также использование методики Direct Preference Optimization (DPO) помогает снизить количество ошибок, обеспечивая надежность и точность.

Ключевые выводы

Запуск OmniVision-968M представляет собой значительный шаг вперед. Сокращение числа токенов снижает вычислительные ресурсы, необходимые для работы, что делает ее идеальной для носимых устройств, мобильных гаджетов и IoT. Эта модель демонстрирует уменьшение времени вывода на 35% по сравнению с предыдущими версиями, сохраняя при этом точность в визуальных задачах.

Как внедрить ИИ в вашу компанию

  • Изучите, как ИИ может изменить вашу работу и выявите возможности для автоматизации.
  • Определите ключевые показатели эффективности (KPI) для улучшения с помощью ИИ.
  • Выберите подходящее решение и начинайте с малого проекта, анализируйте результаты.
  • Расширяйте автоматизацию на основе полученных данных.

Если вам нужны советы по внедрению ИИ, свяжитесь с нами. Подписывайтесь на наш Телеграм-канал для новостей об ИИ.

“`

Полезные ссылки: