Программа оценки VLM от Salesforce AI Research: новый подход к оценке ответов на открытые запросы

Itinai.com it development details code screens blured futuris ee00b4e7 f2cd 46ad 90ca 3140ca10c792 1

«`html

Модели «Язык-Изображение» (VLMs)

Модели VLMs все чаще используются для генерации ответов на запросы о визуальном контенте. Однако они часто создают правдоподобные, но неверные ответы, известные как «галлюцинации». Это снижает доверие к таким системам, особенно в критически важных приложениях.

Проблема оценки ответов VLM

Оценка полезности и правдивости ответов VLM сложна, так как требует понимания визуального контента и проверки каждого утверждения. Традиционные методы оценки не справляются с этой задачей.

Новая методика PROVE

Исследователи из Salesforce AI Research предложили новую методику оценки VLM, названную PROVE. Она позволяет оценивать ответы VLM на открытые визуальные запросы.

Как работает PROVE

Используются детализированные графы сцен, созданные на основе подробных описаний изображений.
Применяется большая языковая модель (LLM) для генерации разнообразных пар вопросов и ответов.
Создаются программы для проверки каждой пары вопросов и ответов.

Это позволяет создать качественный набор данных из 10,5 тыс. сложных пар вопросов и ответов.

Оценка полезности и правдивости

Оценка включает сравнение графов сцен из ответов модели и истинных ответов, что позволяет измерять полезность и правдивость ответов.

Результаты оценки

Результаты показывают, что современные VLMs не всегда достигают хорошего баланса между полезностью и правдивостью. Модели, такие как GPT-4o и Phi-3.5-Vision, показали высокие оценки полезности, но не всегда правдивости.

Выводы

Методика PROVE представляет собой значительный шаг вперед в оценке ответов VLM. Она подчеркивает необходимость создания VLM, которые обеспечивают информативные и точные ответы.

Как использовать ИИ в вашем бизнесе

Если вы хотите развивать свою компанию с помощью ИИ, следуйте этим шагам:

Анализируйте, как ИИ может изменить вашу работу.
Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
Выбирайте подходящее решение из множества доступных вариантов ИИ.
Внедряйте ИИ постепенно, начиная с небольших проектов.

На основе полученных данных расширяйте автоматизацию.

Получите помощь

Если вам нужны советы по внедрению ИИ, пишите нам в Telegram. Следите за новостями о ИИ в нашем Telegram-канале или в Twitter.

Попробуйте AI Sales Bot

Этот AI ассистент в продажах помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж.

Будущее уже здесь!

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab.

«`

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Сотрудничество

Бесплатный ИИ текст генератор

Спросить ИИ чат

Заказать разработку

24.10.2024

Владимир Дьячков PhD

Лучшие ИИ

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

07.05.2024

Лучшие ИИ

Оптимизация предпочтений самоигры (SPPO): новый подход машинного обучения к настройке больших языковых моделей (LLM) на основе обратной связи от человека/ИИ

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
26.03.2025

Лучшие ИИ

DeepSeek-V3-0324: Новый уровень производительности ИИ на Mac Studio

DeepSeek AI представляет DeepSeek-V3-0324: Высокая производительность на Mac Studio Искусственный интеллект (ИИ) продолжает стремительно развиваться, но многие организации сталкиваются с проблемами в создании высокопроизводительных и экономически эффективных моделей.…
16.10.2023

ИИ агенты

ИИ-Агент по автоматизации юридических процессов : подготовка шаблонных документов

Должность ИИ-Агент по автоматизации юридических процессов: подготовка шаблонных документов Общее описание ИИ-Агент по автоматизации юридических процессов — это цифровой специалист, обеспечивающий высокую точность и скорость выполнения рутинных юридических…
21.05.2025

Бесплатный ИИ

Как оформить адаптационный план на первый месяц: искусственный интеллект составит структуру под должность

Как пользоваться чатботом? Все просто: введите в поле должность нового сотрудника и его уровень (например, «стажер» или «топ-менеджер»). Искусственный интеллект проанализирует данные и выдаст адаптационный план, который учитывает:…

HR-специалист
06.03.2025

Лучшие ИИ

Использование Jupyter Notebooks для интерактивного кодирования и анализа данных

Что такое Jupyter Notebooks? Jupyter Notebooks — это мощный инструмент с открытым исходным кодом, который позволяет пользователям создавать и делиться документами, содержащими живой код, уравнения, визуализации и текстовые…

AI Новости
02.07.2024

Лучшие ИИ

Метод машинного обучения на основе концепций с использованием экспертных правил: вероятностный подход

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
21.05.2025

Бесплатный ИИ

Как составить FAQ по обучению для сотрудников: ИИ предложит 20 вопросов и шаблоны ответов

Как чатбот упрощает создание FAQ Представьте, что вы вводите данные о курсе и аудитории — и получаете готовый FAQ с 20 вопросами и ответами. Это реально. Наш инструмент…
07.04.2025

Лучшие ИИ

MMSearch-R1: Революционный подход к активному поиску изображений с использованием обучения с подкреплением

MMSearch-R1: Конечное Обучение С Подкреплением для Активного Поиска Изображений в LMM Большие многомодальные модели (LMM) продемонстрировали выдающиеся способности при обучении на обширных визуально-текстовых данных, значительно продвигая задачи многомодального…