Ученые из UCLA и Стэнфорда представили MRAG-Bench: стандарт для оценки моделей с мультимодальными данными, ориентированных на визуальные задачи.

 Researchers from UCLA and Stanford Introduce MRAG-Bench: An AI Benchmark Specifically Designed for Vision-Centric Evaluation for Retrieval-Augmented Multimodal Models

“`html

Введение в MRAG-Bench

Текущие стандарты оценки, основанные на многомодальном извлечении и генерации (RAG), сосредоточены на текстовом извлечении знаний для ответов на вопросы, что имеет значительные ограничения. В ряде случаев извлечение визуальной информации более полезно и проще, чем доступ к текстовым данным. Новая разработка от исследователей UCLA и Стэнфорда — это MRAG-Bench, тестовый набор, ориентированный на визуальную информацию.

Что такое MRAG-Bench?

MRAG-Bench включает 16,130 изображений и 1,353 вопросов с несколькими вариантами ответов, разработанных людьми. Он помогает оценить эффективность моделей, использующих визуальную информацию, в ситуациях, когда она более выгодна, чем текстовые данные.

Структура MRAG-Bench

Тестовый набор делится на девять сценариев, которые разделены на два ключевых аспекта: понимание перспективы и понимание трансформации. Перспективный аспект включает четыре категории:

  • Угол
  • Частичный
  • Объем
  • Заслонение

Трансформационный аспект фокусируется на временных, биологических и физических изменениях объектов.

Результаты оценки

Результаты показывают, что визуальная информация значительно улучшает производительность моделей по сравнению с текстовой. Например, модель GPT-4o показала лишь 5.82% улучшение с визуальным дополнением, в то время как люди достигли 33.16%. Это подтверждает, что современные модели еще не научились эффективно использовать визуальные знания, как это делают люди.

Как использовать ИИ в вашей компании

Чтобы ваша компания развивалась с помощью ИИ и оставалась на передовом уровне, выполните следующие шаги:

  1. Проанализируйте, как ИИ может изменить вашу работу.
  2. Определите, где можно применить автоматизацию.
  3. Выберите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
  4. Подберите подходящее ИИ решение и внедряйте его постепенно.
  5. На основе полученных данных расширяйте автоматизацию.

Получите помощь и советы

Если вам нужны советы по внедрению ИИ, пишите нам в Telegram. Следите за новостями в нашем Telegram-канале или в Twitter.

Попробуйте AI Sales Bot

Этот ИИ-ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию. Узнайте больше о решениях от AI Lab на itinai.ru. Будущее уже здесь!

“`

Полезные ссылки: