DEIM: Новый ИИ-фреймворк для ускорения сходимости и точности обнаружения объектов в DETR

 DEIM: A New AI Framework that Enhances DETRs for Faster Convergence and Accurate Object Detection

“`html

DEIM: Новый ИИ Фреймворк для Ускоренной Конвергенции и Точной Обнаружения Объектов

Модели обнаружения на основе трансформеров становятся всё более популярными благодаря своей стратегии сопоставления один к одному. В отличие от привычных моделей, таких как YOLO, которые требуют Ненадежной Максимальной Супрессии (NMS) для уменьшения избыточности, модели DETR используют алгоритмы Венгерского сопоставления и многофункциональное внимание, чтобы установить уникальное сопоставление между обнаруженным объектом и истинной меткой.

Проблемы и Решения

Модели DETR имеют ограничения, такие как медленная конвергенция и низкое качество сопоставлений. Это связано с:

  • Разреженным контролем: Присваивание только одного положительного образца на цель ограничивает количество положительных образцов, что негативно сказывается на обучении модели, особенно при обнаружении мелких объектов.
  • Низким качеством сопоставлений: Нехватка пространственного выравнивания приводит к тому, что боксы с низким IOU получают высокие оценки.

Инновации от Intellindust AI Lab

Исследователи разработали DEIM: механизм обнаружения на основе трансформеров с улучшенным сопоставлением для быстрой конвергенции. Он сочетает два новых метода:

  • Плотное O2O: Увеличивает количество целей в каждом обучающем изображении, что приводит к большему количеству положительных образцов.
  • Потеря, учитывающая сопоставимость (MAL): Увеличивает штраф за низкокачественные сопоставления, используя IoU и уверенность в классификации.

Практическое Применение

Пример работы Dense O2O: изображение дублируется на четыре квадрата и затем объединяется в одно целое, увеличивая количество целей и сохраняя структуру сопоставления. MAL упрощает веса потерь для положительных и отрицательных образцов, что позволяет избежать чрезмерного акцента на высококачественных боксе.

Результаты и Преимущества

Внедрив DEIM в модели O2O, такие как D-FINE-L и D-FINE-X, авторы сравнили их с SOTA O2M моделями, и результаты показали, что модели с DEIM превзошли все остальные по стоимости обучения, задержке вывода и точности обнаружения. D-FINE, последняя модель DETR, достигла 0.7 AP и снизила стоимость обучения на 30% после внедрения DEIM.

Заключение

DEIM – это простой фреймворк, который решает проблему медленной конвергенции в моделях на основе DETR. Он продемонстрировал лучшие результаты, особенно в обнаружении мелких объектов, при значительно меньшем числе эпох.

Как использовать ИИ для вашего бизнеса

  • Проанализируйте, как ИИ может изменить вашу работу.
  • Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
  • Внедряйте решения ИИ постепенно, начиная с небольших проектов.
  • На основе полученных данных и опыта расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам в Telegram. Следите за новостями о ИИ в нашем канале или в Twitter.

Попробуйте AI Sales Bot – этот ИИ ассистент в продажах поможет отвечать на вопросы клиентов и генерировать контент для отдела продаж.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!

“`

Полезные ссылки: