
Недавние достижения в области больших языковых моделей (LLMs) значительно улучшили их способности к рассуждению, позволяя выполнять задачи по составлению текста, генерации кода и логическому выводу. Однако эти модели часто сталкиваются с проблемой чрезмерного использования внешних инструментов, когда они необоснованно полагаются на них для задач, которые могут решить сами. Это приводит к увеличению вычислительных затрат и иногда снижению производительности. Для решения этой проблемы необходимы более эффективные механизмы калибровки, которые позволят агентам, управляемым LLM, определять, когда полагаться на свои знания, а когда использовать внешние ресурсы, что в конечном итоге улучшит эффективность и пользовательский опыт.
Исследования показывают, что LLM могут хорошо работать с структурированными задачами, но часто не осознают своих ограничений, что может привести к ошибкам в выводах или неправильному использованию инструментов. Решения таких проблем включают генерацию, дополненную данными, калибровку уверенности и обучение границам знаний. Аналогично, подходы к интеграции инструментов исследуют адаптивное использование, интеграцию внешних модулей и динамические стратегии вызова в зависимости от внутренней неопределенности.
Исследователи из Университета Иллинойс в Урбана-Шампейн и IBM Research AI разработали SMART (Стратегическое Моделируемое Рассуждение с Инструментами) для повышения самосознания LLM и оптимизации использования инструментов. Они представили набор данных SMART-ER, охватывающий математику, время и намерения, что помогает моделям находить баланс между внутренним рассуждением и внешними инструментами через явные обоснования. Модель SMARTAgent, обученная на этом наборе данных, сократила чрезмерное использование инструментов на 24% и повысила производительность на 37%, что позволяет меньшим моделям сравняться по эффективности с GPT-4 и моделями на 70B.
SMART помогает агентам находить баланс между внутренними знаниями и внешними инструментами, уменьшая чрезмерное использование последних. Набор данных SMART-ER помогает моделям различать рассуждения, основанные на знаниях, и те, которые зависят от инструментов. Запросы разбиваются на структурированные шаги, что позволяет моделям определять необходимость использования инструментов. Цепочки рассуждений включают обоснования для уточнения принятия решений и повышения их интерпретируемости. SMARTAgent, обученная на SMART-ER, оптимизирует использование инструментов, сохраняя точность.
Эксперименты продемонстрировали эффективность SMARTAgent в снижении чрезмерного использования инструментов при улучшении показателей рассуждений. Модель была оценена на наборах данных как внутри распределения, так и за его пределами, показав снижение зависимости от инструментов на 24% при одновременном увеличении производительности на 37%. Результаты подчеркивают ее эффективное использование инструментов и способности к обобщению.
В заключение, существует ключевая проблема: агенты часто чрезмерно используют внешние инструменты, даже когда достаточно внутренних знаний. SMART-технология оптимизирует процесс принятия решений, когда агенты должны полагаться на инструменты или на свои знания. Подход на основе данных улучшает самосознание, уменьшая ненужное использование инструментов. Будущие исследования могут сосредоточиться на обучении самоконтролю и метакогнитивном обучении для оптимизации эффективности принятия решений.
Изучите, как технологии искусственного интеллекта могут трансформировать ваш подход к работе, например, с помощью SMART. Найдите процессы, которые можно автоматизировать, определите ключевые показатели эффективности, чтобы убедиться, что ваши инвестиции в ИИ приносят положительные результаты.
Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Подпишитесь на наш Telegram, чтобы следить за последними новостями в области ИИ.
Посмотрите практический пример решения на базе ИИ: торговый бот от https://itinai.ru/aisales, предназначенный для автоматизации общения с клиентами круглосуточно и управления взаимодействием на всех этапах пути клиента.