Новый инструмент для разработки программного обеспечения: Aide Framework от CodeStory улучшает сотрудничество множества агентов, достигая 40,3% принятых решений на SWE-Bench-Lite

 Transforming Software Development with Multi-Agent Collaboration: CodeStory’s Aide Framework Sets State-of-the-Art on SWE-Bench-Lite with 40.3% Accepted Solutions

“`html

Новые возможности в разработке программного обеспечения

Недавние достижения в области программной инженерии подняли планку для производительности и командной работы. Команда исследователей из Codestory недавно разработала мультиагентный фреймворк под названием Aide, который достиг замечательных 40,3% принятых решений на тесте SWE-Bench-Lite, устанавливая новый уровень для данной области. Благодаря своей интеграции в среды разработки и повышенной производительности этот фреймворк обещает полностью изменить способ работы разработчиков с кодом.

Подробнее

Практические решения и ценность

Этот фреймворк основан на идее использования нескольких агентов, каждый из которых отвечает за определенный символ кода, такой как класс, функция, перечисление или тип. Это атомарный уровень гранулярности позволяет естественное языковое взаимодействие между ботами, позволяя каждому сосредотачиваться на определенной задаче. Протокол сервера языка (LSP) обеспечивает коммуникацию между агентами с использованием протоколов, гарантирующих точную и эффективную передачу информации.

На практике это означает, что до 30 агентов может быть активными одновременно во время одного запуска, сотрудничая в принятии решений и обмене информацией. Возможности фреймворка были проиллюстрированы его замечательным выступлением на тесте SWE-Bench-Lite. Для создания редакторской среды для агентов использовались ClaudeSonnet3.5 и GPT-4o через использование Pyright и Jedi. GPT-4o проявил себя в отличном редактировании кода, а Sonnet3.5, известный своим надежным агентным поведением, помогал организовывать и навигировать кодовую базу.

Агентный аспект Sonnet 3.5 был очень значимым. Он был первой парадигмой, предложившей разделение функций вместо усложнения уже сложных, что свидетельствует о сложных знаниях по поддерживаемости и структуре кода. Это поведение в сочетании с отличными возможностями редактирования кода GPT-4o позволило фреймворку выступить заметно лучше, чем ранние версии.

Выбор теста SWE-Bench-Lite обусловлен его способностью воспроизводить сложности реального мира, предоставляя агентам надежную среду тестирования. В процессе тестирования получены важные уроки, одним из которых было значение коллаборации агентов. Вместе агенты, каждый ответственный за различный символ кода, могли быстро выполнять задачи и часто исправляли несвязанные проблемы, такие как ошибки линтера или TODO. Этот совместный метод не только улучшил качество кода, но также продемонстрировал способность агентных систем самостоятельно управлять сложными задачами программирования.

Команда поделилась, что до полной интеграции этого мультиагентного фреймворка в среды разработки еще осталось преодолеть несколько препятствий. В настоящее время ведется исследование, направленное на обеспечение гладкой коммуникации между человеческими разработчиками и агентами, управление одновременными изменениями кода и сохранение стабильности кода. Кроме того, команда изучает возможности оптимизации производительности фреймворка, в частности скорости вывода и затрат на интеллект.

Конечная цель команды заключается в расширении возможностей человеческих разработчиков, а не в их замене. Цель заключается в улучшении точности и эффективности процесса разработки программного обеспечения путем предоставления ряда специализированных агентов, освобождая разработчиков от рутиносных задач и позволяя им сосредоточиться на более сложных проблемах.

Впереди больше на MarkTechPost

Как AI может помочь вашей компании?

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте AI-технологии. Решения ИИ помогают автоматизировать рутинные задачи, предоставляют аналитическую информацию для выявления новых возможностей и определения подходящих КПЭ для улучшения процессов.

Выберите подходящее решение и внедряйте AI постепенно, начиная с небольших проектов, анализируя результаты и расширяя автоматизацию на основе полученных данных.

Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или на Twitter.

Попробуйте AI Sales Bot, который помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru. Будущее уже здесь!

“`

Полезные ссылки: