“`html
Дизайн вычислительных рабочих процессов для приложений искусственного интеллекта
Создание вычислительных рабочих процессов для приложений искусственного интеллекта, таких как чат-боты и помощники по кодированию, является сложной задачей из-за необходимости управления многочисленными гетерогенными параметрами, такими как подсказки и гиперпараметры машинного обучения. Ошибки после развертывания требуют ручных обновлений, что увеличивает сложность. Исследование изучает проблемы оптимизации, направленные на автоматизацию проектирования и обновления этих рабочих процессов. В связи с их сложной природой, включающей взаимозависимые шаги и полу-черный ящик операций, традиционные методы оптимизации, такие как байесовская оптимизация и обучение с подкреплением, часто требуют большей эффективности. Оптимизаторы на основе LLM были предложены для улучшения эффективности, но большинство из них все еще полагаются на скалярную обратную связь и обрабатывают рабочие процессы только с одним компонентом.
Trace: автоматизация проектирования и обновления систем искусственного интеллекта
Исследователи из Microsoft Research и Стэнфордского университета предлагают фреймворк под названием Trace для автоматизации проектирования и обновления систем искусственного интеллекта, таких как помощники по кодированию и роботы. Trace рассматривает вычислительный рабочий процесс как граф, аналогичный нейронным сетям, и оптимизирует гетерогенные параметры с использованием оптимизации с помощью Trace Oracle (OPTO). Trace эффективно преобразует рабочие процессы в экземпляры OPTO, позволяя общему оптимизатору OptoPrime обновлять параметры на основе следов выполнения и обратной связи итеративно. Этот подход повышает эффективность оптимизации в различных областях, превосходя специализированные оптимизаторы в задачах, таких как оптимизация подсказок, настройка гиперпараметров и проектирование контроллеров роботов.
Преимущества фреймворка Trace
В отличие от существующих фреймворков, таких как LangChain, Semantic Kernels, AutoGen и DSPy, позволяющих составлять и оптимизировать вычислительные рабочие процессы, в основном используя скалярную обратную связь и методы поиска в черном ящике, Trace использует трассировку выполнения для автоматической оптимизации, обобщая вычислительный граф для подхода к различным рабочим процессам. Фреймворк OPTO Trace поддерживает совместную оптимизацию подсказок, гиперпараметров и кодов с обратной связью и динамически адаптируется к изменениям в структуре рабочего процесса. Он расширяет принципы автодифференцирования на недифференцируемые рабочие процессы, обеспечивая эффективных самоадаптирующихся агентов и общегецельную оптимизацию в различных приложениях, превосходя специализированные оптимизаторы в нескольких задачах.
Оптимизатор OPTO и алгоритм OptoPrime
OPTO является основой Trace, определяя графовую абстракцию для итеративной оптимизации. Вычислительный граф представляет собой DAG, где узлы представляют объекты, а ребра обозначают входно-выходные отношения. В OPTO оптимизатор выбирает параметры, а Trace Oracle возвращает обратную связь трассировки, состоящую из вычислительного графа и ввода на выходе. Эта обратная связь может включать оценки, градиенты или подсказки на естественном языке. Оптимизатор использует эту обратную связь для итеративного обновления параметров. В отличие от черных ящиков, трассировка выполнения обеспечивает четкий путь к выходу, обеспечивая эффективное обновление параметров. Trace использует OPTO для оптимизации различных рабочих процессов, абстрагируя дизайн и компоненты, специфичные для области.
Оптимизационный алгоритм на основе LLM OptoPrime разработан для проблемы OPTO. Он использует возможности кодирования и отладки LLM для обработки подграфов трассировки выполнения. Обратная связь Trace является псевдо-алгоритмом, позволяющим LLM предлагать обновления параметров. OptoPrime включает модуль памяти для отслеживания прошлых пар параметров и обратной связи, улучшая устойчивость. Эксперименты показывают эффективность OptoPrime в числовой оптимизации, управлении трафиком, оптимизации подсказок и задачах управления роботами с долгосрочной перспективой. OptoPrime демонстрирует превосходную производительность по сравнению с другими оптимизаторами, особенно при использовании информации о трассировке выполнения и памяти.
Будущие направления развития
Trace преобразует проблемы оптимизации вычислительных рабочих процессов в проблемы OPTO, что эффективно демонстрируется с помощью оптимизатора OPTO, OptoPrime. Это является первым шагом к новой парадигме оптимизации с различными будущими направлениями. Улучшения в рассуждении LLM, такие как Chain-of-Thought, Few-Shot Prompting, Tool Use и Multi-Agent Workflows, могут улучшить или вдохновить новые оптимизаторы OPTO. Гибридный рабочий процесс, объединяющий LLM и алгоритмы поиска с специализированными инструментами, может привести к общегецельному оптимизатору OPTO. Специализация пропагатора для конкретных вычислений, особенно для больших графов, и разработка оптимизаторов, способных проводить контрфактические рассуждения, могут улучшить эффективность. Недокументальные контексты и обратная связь также могут расширить применимость Trace.
Подробности, проект и GitHub можно найти на соответствующих ресурсах. Вся заслуга за это исследование принадлежит его авторам. Также не забудьте подписаться на наш Твиттер и присоединиться к нашему каналу в Телеграме и группе в LinkedIn. Если вам нравится наша работа, вам понравится и наша рассылка.
Не забудьте присоединиться к нашему сообществу в Reddit.
Найдите предстоящие вебинары по искусственному интеллекту здесь.
Оригинальная статья: MarkTechPost