Itinai.com flat lay of a minimalist ai business toolkit. smal d512725d 5416 4042 96d5 62b63d1987a9 3
Itinai.com flat lay of a minimalist ai business toolkit. smal d512725d 5416 4042 96d5 62b63d1987a9 3

MMLONGBENCH: Новый стандарт оценки моделей с длинным контекстом в визуально-языковом моделировании

Введение в MMLONGBENCH

Недавние достижения в области моделирования с длинным контекстом значительно улучшили возможности больших языковых моделей (LLMs) и больших моделей языка и изображения (LVLMs). Модели языка и изображения с длинным контекстом (LCVLMs) теперь способны обрабатывать сотни изображений и тысячи текстовых токенов за один проход. Однако разработка эффективных оценочных стандартов для этих моделей не успевает за их развитием, что вызывает неопределенность в их производительности в условиях длинного контекста.

Проблемы существующих стандартов

Текущие оценочные стандарты имеют несколько ограничений:

  • Ограниченное покрытие задач.
  • Недостаточное разнообразие типов изображений.
  • Отсутствие контроля за длиной контекста.
  • Оценка только одной длины контекста.

Представляем MMLONGBENCH

Исследователи из HKUST, Tencent AI Seattle Lab, Университета Эдинбурга, Miniml.AI и NVIDIA AI Technology Center предложили MMLONGBENCH, первый комплексный стандарт для оценки LCVLMs. Этот стандарт включает 13,331 примеров по пяти категориям задач, включая Visual RAG и Many-Shot In-Context Learning (ICL), охватывая как натуральные, так и синтетические типы изображений.

Методология и оценка

Для создания сценариев с длинным контекстом исследователи вставили золотые отрывки с ответами среди больших наборов отвлекающих отрывков, полученных из Википедии. Оценка MMLONGBENCH показала, что все модели сталкиваются с трудностями, причем закрытые модели, как правило, показывают лучшие результаты.

Заключение

Введение MMLONGBENCH является значительным шагом вперед в оценке LCVLMs в различных задачах. Этот стандарт предоставляет надежную основу для диагностики возможностей моделей и подчеркивает важные проблемы, с которыми сталкиваются современные модели.

Практические решения для бизнеса

Изучите, как технологии искусственного интеллекта могут изменить ваш подход к работе:

  • Ищите процессы, которые можно автоматизировать, чтобы повысить эффективность.
  • Определите важные ключевые показатели эффективности (KPI) для оценки влияния инвестиций в ИИ.
  • Выбирайте инструменты, соответствующие вашим потребностям, и настраивайте их под свои цели.
  • Начните с небольшого проекта, соберите данные о его эффективности и постепенно расширяйте использование ИИ.

Контактная информация

Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей в области ИИ, подписывайтесь на наш Telegram.

Пример решения на базе ИИ

Посмотрите на практический пример решения на базе ИИ: бот для продаж, разработанный для автоматизации взаимодействия с клиентами и управления взаимодействиями на всех этапах клиентского пути.

ИИ Бизнес-инкубатор itinai.ru будет работать на вас. Получите свой цифровой продукт и готовую модель дохода

ИИ-агенты интеллектуальная автоматизация бизнеса

Готовые ИТ — решения для бизнеса

Новости в сфере искусственного интеллекта