✅ Новый инструмент для разработки программного обеспечения: Aide Framework от CodeStory улучшает сотрудничество множества агентов, достигая 40,3% принятых решений на SWE-Bench-Lite

«`html

Новые возможности в разработке программного обеспечения

Недавние достижения в области программной инженерии подняли планку для производительности и командной работы. Команда исследователей из Codestory недавно разработала мультиагентный фреймворк под названием Aide, который достиг замечательных 40,3% принятых решений на тесте SWE-Bench-Lite, устанавливая новый уровень для данной области. Благодаря своей интеграции в среды разработки и повышенной производительности этот фреймворк обещает полностью изменить способ работы разработчиков с кодом.

Подробнее

Практические решения и ценность

Этот фреймворк основан на идее использования нескольких агентов, каждый из которых отвечает за определенный символ кода, такой как класс, функция, перечисление или тип. Это атомарный уровень гранулярности позволяет естественное языковое взаимодействие между ботами, позволяя каждому сосредотачиваться на определенной задаче. Протокол сервера языка (LSP) обеспечивает коммуникацию между агентами с использованием протоколов, гарантирующих точную и эффективную передачу информации.

На практике это означает, что до 30 агентов может быть активными одновременно во время одного запуска, сотрудничая в принятии решений и обмене информацией. Возможности фреймворка были проиллюстрированы его замечательным выступлением на тесте SWE-Bench-Lite. Для создания редакторской среды для агентов использовались ClaudeSonnet3.5 и GPT-4o через использование Pyright и Jedi. GPT-4o проявил себя в отличном редактировании кода, а Sonnet3.5, известный своим надежным агентным поведением, помогал организовывать и навигировать кодовую базу.

Агентный аспект Sonnet 3.5 был очень значимым. Он был первой парадигмой, предложившей разделение функций вместо усложнения уже сложных, что свидетельствует о сложных знаниях по поддерживаемости и структуре кода. Это поведение в сочетании с отличными возможностями редактирования кода GPT-4o позволило фреймворку выступить заметно лучше, чем ранние версии.

Выбор теста SWE-Bench-Lite обусловлен его способностью воспроизводить сложности реального мира, предоставляя агентам надежную среду тестирования. В процессе тестирования получены важные уроки, одним из которых было значение коллаборации агентов. Вместе агенты, каждый ответственный за различный символ кода, могли быстро выполнять задачи и часто исправляли несвязанные проблемы, такие как ошибки линтера или TODO. Этот совместный метод не только улучшил качество кода, но также продемонстрировал способность агентных систем самостоятельно управлять сложными задачами программирования.

Команда поделилась, что до полной интеграции этого мультиагентного фреймворка в среды разработки еще осталось преодолеть несколько препятствий. В настоящее время ведется исследование, направленное на обеспечение гладкой коммуникации между человеческими разработчиками и агентами, управление одновременными изменениями кода и сохранение стабильности кода. Кроме того, команда изучает возможности оптимизации производительности фреймворка, в частности скорости вывода и затрат на интеллект.

Конечная цель команды заключается в расширении возможностей человеческих разработчиков, а не в их замене. Цель заключается в улучшении точности и эффективности процесса разработки программного обеспечения путем предоставления ряда специализированных агентов, освобождая разработчиков от рутиносных задач и позволяя им сосредоточиться на более сложных проблемах.

Впереди больше на MarkTechPost

Как AI может помочь вашей компании?

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте AI-технологии. Решения ИИ помогают автоматизировать рутинные задачи, предоставляют аналитическую информацию для выявления новых возможностей и определения подходящих КПЭ для улучшения процессов.

Выберите подходящее решение и внедряйте AI постепенно, начиная с небольших проектов, анализируя результаты и расширяя автоматизацию на основе полученных данных.

Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или на Twitter.

Попробуйте AI Sales Bot, который помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru. Будущее уже здесь!

«`

Новый инструмент для разработки программного обеспечения: Aide Framework от CodeStory улучшает сотрудничество множества агентов, достигая 40,3% принятых решений на SWE-Bench-Lite

Новые возможности в разработке программного обеспечения

Практические решения и ценность

Как AI может помочь вашей компании?

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

Монетизация Telegram-канала с цитатами и мотивацией

Инфлюенсер и AI — монетизация личного бренда

Монетизация AI в нише копирайтинга

AI в нише животных — бизнес для зоомагазина и блогера

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Специалист по обучению сотрудников : персонализация обучающих материалов

ИИ-Агент для автоматизации медицинских записей : структурирование данных пациентов

ИИ-Аналитик социальных сетей : генерация стратегий контента

ИИ-Специалист по автоматизации интеграции систем : настройка API и потоков данных

Как UX-копирайтеру написать microcopy для формы регистрации: ИИ предложит 3 варианта текста под поле

Как вести график переговорных комнат: искусственный интеллект поможет с шаблоном и правилами бронирования

Как отследить сроки хранения документов: ИИ предложит таблицу с типами и нормативами

Как правильно оформить лист согласования документа: ИИ создаст шаблон с маршрутами и подписями

Как провести качественную оценку рисков: ИИ сформирует матрицу оценки и предложит сценарии

Как сформировать политику риск-менеджмента для компании: ИИ предложит структуру и ключевые положения

Лучший ИИ онлайн

Arcee AI представляет Arcee Agent: современная модель языка с 7 миллиардами параметров, специально разработанная для вызова функций и использования инструментов.

Система управления заявками с ИИ-классификацией и автоматизацией решения

Ученые из Toyota Research Institute представляют SUPRA: улучшение эффективности трансформера с помощью рекуррентных нейронных сетей

VLM2Vec-V2: Единая платформа для многомодального обучения в компьютерном зрении

Как провести оценку эффективности обучения по модели Киркпатрика: ИИ предложит чек-лист и шаблон отчета

Улучшение LLM: метод самосовершенствования, когда LLM оценивает свои собственные решения и использует обратную связь для улучшения своих навыков оценки.

Как обработать входящее обращение по шаблону: искусственный интеллект подскажет универсальный текст ответа

Куки-политика

О нас

Условия использования

Отказ от ответственности

Доступность

Карта сайта