ReTool: Новый фреймворк для оптимизации математического мышления LLM с использованием инструментов

ReTool: Инновационная платформа для оптимизации рассуждений LLM с помощью инструментов

Усиленное обучение (RL) является мощной техникой для улучшения рассуждений больших языковых моделей (LLM), позволяя им развивать и уточнять длинные цепочки мысли (CoT). Модели, такие как OpenAI o1 и DeepSeek R1, продемонстрировали высокую эффективность в задачах текстового рассуждения, однако сталкиваются с ограничениями в задачах, требующих точных числовых вычислений или символических манипуляций, таких как геометрические рассуждения, сложные вычисления или решение уравнений.

Основные функции ReTool

Недавние исследования показывают, что LLM могут развивать метакогнитивные способности через CoT-подсказки, а исследования эволюционировали от увеличения вычислительных ресурсов во время обучения к их использованию на этапе тестирования. ReTool предлагает ряд решений для задач математического решения:

  • Динамическое выполнение кода: На этапе рассуждения возможности модели интегрируются с реальным исполнением кода в реальном времени.
  • Автоматизированное усиленное обучение: Модель обучается, когда и как использовать инструменты на основе обратной связи о результатах.

Методы сбора данных

ReTool включает два основных этапа: начальная подготовка с использованием синтетических данных и последующее усиленное обучение с интеграцией выполнения кода. Для этого используется высококачественная математическая база данных из различных источников, включая открытые наборы данных, такие как OpenThoughts.

Результаты

Использование ReTool привело к значительному увеличению эффективности. Например, модель ReTool (Qwen2.5-32B-Instruct) достигла 67,0% точности на AIME2024 и 49,3% на AIME2025 после всего лишь 400 шагов обучения, что значительно превышает показатели традиционных текстовых подходов.

Заключение

В заключение, ReTool представляет собой новый RL-фреймворк, который позволяет LLM самостоятельно улучшать свои способности в математическом рассуждении, эффективно используя инструменты. Результаты показывают, что интегрированное использование инструментов в RL представляют собой перспективное направление для развития вычислительных возможностей LLM.

Как AI может трансформировать ваш бизнес

Исследуйте, как технологии искусственного интеллекта могут изменить ваш подход к работе:

  • Автоматизация процессов взаимодействия с клиентами, где AI может принести наибольшую ценность.
  • Идентификация ключевых показателей (KPI) для оценки положительного воздействия ваших инвестиций в AI.
  • Выбор инструментов, которые соответствуют вашим целям и позволяют их настраивать.
  • Начните с небольшого проекта, собирая данные о его эффективности, и постепенно расширяйте использование AI в вашей работе.

Если вам нужна помощь в управлении AI в бизнесе, свяжитесь с нами по адресу hello@itinai.ru.

Не забудьте подписаться на наш Telegram, чтобы быть в курсе последних новостей AI.

Рассмотрите практический пример решения на основе AI: бот для продаж от itinai.ru/aisales, предназначенный для автоматизации клиентских разговоров в любое время и управления взаимодействиями на всех этапах пути клиента.

AI_Image

Новости в сфере искусственного интеллекта