Автоматизация создания среды и задач для улучшения планирования в агентах на основе LLM с 592 средами и 7,246 траекториями.

 AgentGen: Automating Environment and Task Generation to Enhance Planning Abilities in LLM-Based Agents with 592 Environments and 7,246 Trajectories

“`html

Как Large Language Models (LLMs) трансформируют искусственный интеллект

Большие языковые модели (LLMs) преобразовали искусственный интеллект, особенно в разработке систем на основе агентов. Эти системы требуют взаимодействия с различными средами и выполнения действий для достижения конкретных целей. Улучшение планировочных возможностей агентов на основе LLM стало критической областью исследований из-за сложной природы и важной необходимости точного выполнения задач во многих приложениях.

Решение проблемы ручного труда

Одной из значительных проблем в этой области исследований является интенсивный ручной труд, необходимый для создания разнообразных и обширных планировочных сред и задач. Текущие методологии в основном зависят от ручно разработанных сценариев, что ограничивает разнообразие и количество доступных данных для обучения. Для решения этой проблемы исследователи предложили автоматизированные техники для генерации широкого спектра сред и планировочных задач, обогащая таким образом наборы данных для обучения агентов на основе LLM.

Новый подход AGENTGEN

Команда исследователей из Университета Гонконга и корпорации Microsoft предложила новую структуру под названием AGENTGEN, которая использует LLM для автоматизации генерации сред и соответствующих планировочных задач. Этот инновационный подход включает два основных этапа: генерацию среды и генерацию задач. Вначале структура использует корпус вдохновения, включающий разнообразные текстовые сегменты, для создания подробных и разнообразных спецификаций среды. Затем AGENTGEN генерирует связанные планировочные задачи, охватывающие как простые, так и сложные, обеспечивая плавное увеличение сложности и облегчая эффективное обучение для LLM.

Уникальные особенности AGENTGEN

AGENTGEN отличается использованием сложного процесса генерации среды. Исследователи разработали корпус вдохновения для синтеза спецификаций среды, включающий подробное описание среды, описания состояний и пространств действий, а также определения функций перехода. Этот метод обеспечивает высокий уровень разнообразия в созданных средах, создавая множество уникальных и сложных сценариев для обучения агентов.

Процесс генерации задач в AGENTGEN дополнительно улучшает данные для обучения с помощью метода двунаправленной эволюции, известного как BI-EVOL. Этот метод развивает задачи в двух направлениях: упрощение целевых условий для создания более простых задач и увеличение сложности для разработки более сложных. Такой подход приводит к формированию обширного набора планировочных задач, поддерживающего плавную и эффективную кривую обучения для LLM. Результатом применения BI-EVOL стало создание 592 уникальных сред, каждая с 20 задачами, что привело к 7 246 траекториям высокого качества для обучения.

Эффективность AGENTGEN

Эффективность AGENTGEN была тщательно оценена с использованием платформы AgentBoard. Результаты были впечатляющими, демонстрируя значительное улучшение планировочных способностей агентов на основе LLM. Модель AGENTGEN-tuned Llama-3 8B превзошла GPT-3.5 в общей производительности и, в некоторых задачах, даже превзошла GPT-4. Конкретно AGENTGEN достиг более чем в пять раз улучшения по сравнению с исходной моделью Llama-3 8B в задачах внутри области, с уровнем успешных выполнений, увеличившимся с 1,67 до 11,67. Кроме того, AGENTGEN продемонстрировал существенное улучшение производительности в задачах вне области, достигнув уровня успешных выполнений 29,1 в Alfworld по сравнению с 17,2 для GPT-3.5.

AGENTGEN продемонстрировал устойчивые возможности обобщения для различных моделей и задач. Успех структуры проявился в ее способности улучшить планировочную производительность нескольких LLM, включая более маленькие модели 7-8B. Например, Llama-3 8B после обучения с использованием AGENTGEN показал увеличение уровня успешных выполнений на 10,0 и увеличение темпа прогресса на 9,95. Эти результаты подчеркивают эффективность AGENTGEN в улучшении возможностей агентов на основе LLM, независимо от используемой модели.

Выводы

AGENTGEN, автоматизируя генерацию разнообразных сред и планировочных задач, решает ограничения ручного проектирования и предлагает масштабный, эффективный подход к улучшению производительности агентов. Способность структуры генерировать данные высокого качества и ее успешное выполнение в задачах как внутри, так и вне области подчеркивают ее потенциал для революционизации обучения и применения агентов на основе LLM. Вклад AGENTGEN в методики обучения агентов готов улучшить разработку интеллектуальных систем, способных выполнять сложные планировочные задачи с большей точностью и эффективностью.

Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter и присоединиться к нашей Telegram-группе и группе LinkedIn. Если вам нравится наша работа, вам понравится наш новостной бюллетень.

Не забудьте присоединиться к нашему сообществу Reddit.

Найдите предстоящие вебинары по ИИ здесь.

Arcee AI выпустила DistillKit: открытый и простой в использовании инструмент для дистилляции моделей, обеспечивающий создание эффективных малых языковых моделей высокой производительности.

Источник: MarkTechPost.


“`

Полезные ссылки: