Исследование Salesforce AI предлагает набор данных для улучшения консистентности мышления LLM

Itinai.com it development details code screens blured futuris ee00b4e7 f2cd 46ad 90ca 3140ca10c792 1

«`html

Проблемы больших языковых моделей (LLMs)

Большие языковые модели часто не могут последовательно и точно выполнять многоступенчатое рассуждение, особенно в сложных задачах, таких как решение математических задач и генерация кода. Они испытывают трудности с обнаружением и обучением на ошибках, так как в основном обучаются на правильных решениях.

Новое решение от исследователей

Исследователи из Университета Нотр-Дам и Salesforce AI разработали инновационную систему, которая генерирует несколько путей рассуждения для сложных задач. Проверяющие оценивают эти пути и ранжируют результаты по правильности, что улучшает точность.

Создание уникального набора данных

Команда создала обширный набор данных, включающий как правильные, так и неправильные решения для математических и кодовых задач. Этот набор данных уникален, так как содержит разнообразные шаблоны решений, что помогает проверяющим лучше различать правильные и ошибочные ответы.

Использование новых методов верификации

Исследователи интегрировали стратегии Chain-of-Thought (CoT) и Program-of-Thought (PoT) для создания нового подхода к верификации, который сочетает в себе пошаговое рассуждение и проверку исполняемого кода.

Результаты и достижения

Результаты показывают значительные улучшения по сравнению с предыдущими методами. Проверяющие Math-Rev и Code-Rev достигли передовой точности на таких тестах, как GSM8k и MATH, даже превзойдя производительность GPT-4o и LLaMA3.

Заключение

Это исследование представляет новый подход к улучшению возможностей рассуждения LLM, интегрируя совместную верификацию с несколькими путями рассуждения. Исследователи стремятся способствовать будущим достижениям в области повышения надежности LLM.

Как ИИ может помочь вашей компании

Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, следуйте этим шагам:

Проанализируйте, как ИИ может изменить вашу работу.
Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
Подберите подходящее решение из множества доступных вариантов ИИ.
Внедряйте ИИ постепенно: начните с малого проекта и анализируйте результаты.

Получите помощь и советы

Если вам нужны советы по внедрению ИИ, пишите нам в наш Телеграм-канал. Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!

«`