FPT Software AI Center представляет HyperAgent: уникальная система общего назначения для решения различных задач по разработке программного обеспечения в масштабе, достигающая передовых показателей на SWE-Bench и Defects4J.

 FPT Software AI Center Introduces HyperAgent: A Groundbreaking Generalist Agent System to Resolve Various Software Engineering Tasks at Scale, Achieving SOTA Performance on SWE-Bench and Defects4J

“`html

Гиперагент: новая система для решения задач программной инженерии

Большие языковые модели (LLM) революционизировали разработку программного обеспечения, демонстрируя удивительные возможности в различных задачах кодирования. Исследователи из FPT Software AI Center, Вьетнам, представляют HyperAgent, новейшую мультиагентную систему, разработанную для решения широкого спектра задач программной инженерии на различных языках программирования путем имитации рабочих процессов человеческих разработчиков.

Практические решения и ценность

HyperAgent состоит из четырех специализированных агентов – Планировщика, Навигатора, Редактора кода и Исполнителя – управляющих полным жизненным циклом задач программной инженерии, от начальной концепции до окончательной верификации. Через обширные оценки HyperAgent демонстрирует конкурентоспособную производительность в различных задачах программной инженерии:

  • Решение проблем GitHub: успешность 25,01% на SWE-Bench-Lite и 31,40% на SWE-Bench-Verified, конкурентоспособная производительность по сравнению с существующими методами, такими как AutoCodeRover, SWE-Agent, Agentless и др.
  • Генерация кода в масштабе репозитория (RepoExec): точность 53,3% при навигации по кодовым базам и извлечении правильного контекста.
  • Локализация ошибок и исправление программ (Defects4J): точность 59,70% в локализации ошибок и успешные исправления для 29,8% ошибок Defects4J, достигнута лучшая производительность в этих двух задачах.

Эта работа представляет собой значительный прогресс в создании универсальных автономных агентов, способных обрабатывать сложные многоэтапные задачи программной инженерии в различных областях и языках.

Методология

HyperAgent вдохновлен типичными рабочими процессами разработчиков для решения любых задач программной инженерии и состоит из четырех итеративных фаз в типичном рабочем процессе программной инженерии: Анализ и Планирование, Локализация функций, Редактирование и Исполнение. Эти фазы повторяются по мере необходимости, а процесс адаптируется к конкретным требованиям задачи и опыту разработчика.

Преимущества

Дизайн акцентирует три основных преимущества по сравнению с существующими методами:

  • Универсальность: система легко адаптируется к широкому спектру задач с минимальными изменениями конфигурации и небольшими дополнительными усилиями для внедрения новых модулей в систему.
  • Эффективность: каждый агент оптимизирован для управления процессами с различными уровнями сложности, требующими разной степени интеллекта от LLM. Например, для навигации можно использовать легкую и вычислительно эффективную LLM, в то время как для более сложных задач, таких как редактирование или исполнение, требуются более продвинутые возможности LLM.
  • Масштабируемость: система построена для эффективного масштабирования при развертывании в реальных сценариях, где количество подзадач значительно большое.

Заключение

HyperAgent – это универсальная мультиагентная система, предназначенная для решения широкого спектра задач программной инженерии. Обширные оценки по различным бенчмаркам демонстрируют, что HyperAgent не только соответствует, но часто превосходит производительность специализированных систем. Успех HyperAgent подчеркивает потенциал универсальных подходов в программной инженерии, предлагая инструмент, способный адаптироваться к различным задачам с минимальными изменениями конфигурации. Его дизайн акцентирует универсальность, эффективность и масштабируемость, что делает его подходящим для реальных сценариев разработки программного обеспечения, где задачи могут значительно различаться по сложности и масштабу.

Возможное будущее может включать интеграцию HyperAgent с существующими средами разработки и системами управления версиями, а также исследование его потенциала в специализированных областях, таких как обзор кода с уклоном на безопасность или оптимизацию производительности, улучшение его объяснимости и постоянное обновление его базы знаний. Эти усовершенствования могут дальше оптимизировать рабочий процесс программной инженерии, расширить применимость HyperAgent, увеличить доверие среди разработчиков и обеспечить его долгосрочную актуальность в быстро развивающейся области программной инженерии.

Подробнее о работе и GitHub вы можете найти на официальном сайте FPT Software AI Center.

Если вам нужны советы по внедрению ИИ, пишите нам на https://t.me/itinai. Следите за новостями о ИИ в нашем Телеграм-канале t.me/itinainews или в Twitter @itinairu45358.

Попробуйте AI Sales Bot https://itinai.ru/aisales. Этот AI ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru. Будущее уже здесь!

“`

Полезные ссылки: