“`html
DEIM: Новый ИИ Фреймворк для Ускоренной Конвергенции и Точной Обнаружения Объектов
Модели обнаружения на основе трансформеров становятся всё более популярными благодаря своей стратегии сопоставления один к одному. В отличие от привычных моделей, таких как YOLO, которые требуют Ненадежной Максимальной Супрессии (NMS) для уменьшения избыточности, модели DETR используют алгоритмы Венгерского сопоставления и многофункциональное внимание, чтобы установить уникальное сопоставление между обнаруженным объектом и истинной меткой.
Проблемы и Решения
Модели DETR имеют ограничения, такие как медленная конвергенция и низкое качество сопоставлений. Это связано с:
- Разреженным контролем: Присваивание только одного положительного образца на цель ограничивает количество положительных образцов, что негативно сказывается на обучении модели, особенно при обнаружении мелких объектов.
- Низким качеством сопоставлений: Нехватка пространственного выравнивания приводит к тому, что боксы с низким IOU получают высокие оценки.
Инновации от Intellindust AI Lab
Исследователи разработали DEIM: механизм обнаружения на основе трансформеров с улучшенным сопоставлением для быстрой конвергенции. Он сочетает два новых метода:
- Плотное O2O: Увеличивает количество целей в каждом обучающем изображении, что приводит к большему количеству положительных образцов.
- Потеря, учитывающая сопоставимость (MAL): Увеличивает штраф за низкокачественные сопоставления, используя IoU и уверенность в классификации.
Практическое Применение
Пример работы Dense O2O: изображение дублируется на четыре квадрата и затем объединяется в одно целое, увеличивая количество целей и сохраняя структуру сопоставления. MAL упрощает веса потерь для положительных и отрицательных образцов, что позволяет избежать чрезмерного акцента на высококачественных боксе.
Результаты и Преимущества
Внедрив DEIM в модели O2O, такие как D-FINE-L и D-FINE-X, авторы сравнили их с SOTA O2M моделями, и результаты показали, что модели с DEIM превзошли все остальные по стоимости обучения, задержке вывода и точности обнаружения. D-FINE, последняя модель DETR, достигла 0.7 AP и снизила стоимость обучения на 30% после внедрения DEIM.
Заключение
DEIM – это простой фреймворк, который решает проблему медленной конвергенции в моделях на основе DETR. Он продемонстрировал лучшие результаты, особенно в обнаружении мелких объектов, при значительно меньшем числе эпох.
Как использовать ИИ для вашего бизнеса
- Проанализируйте, как ИИ может изменить вашу работу.
- Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
- Внедряйте решения ИИ постепенно, начиная с небольших проектов.
- На основе полученных данных и опыта расширяйте автоматизацию.
Если вам нужны советы по внедрению ИИ, пишите нам в Telegram. Следите за новостями о ИИ в нашем канале или в Twitter.
Попробуйте AI Sales Bot – этот ИИ ассистент в продажах поможет отвечать на вопросы клиентов и генерировать контент для отдела продаж.
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!
“`