
Знакомьтесь с LocAgent: ИИ-агенты на основе графов для трансформации локализации кода в масштабируемом программном обеспечении
Обслуживание программного обеспечения является важной частью жизненного цикла разработки, где разработчики регулярно возвращаются к существующим кодовым базам для исправления ошибок, внедрения новых функций и оптимизации производительности. Ключевой задачей на этом этапе является локализация кода, которая заключается в определении конкретных мест в кодовой базе, которые необходимо изменить.
Проблемы локализации кода
Одной из самых настойчивых проблем в обслуживании программного обеспечения является точная идентификация соответствующих частей кодовой базы, требующих изменений на основе сообщений об ошибках или запросов на функции. Часто в описаниях проблем используются естественные языки, упоминающие симптомы, но не указывающие на истинную причину в коде. Это затрудняет разработчикам и автоматизированным инструментам связывать описания с конкретными элементами кода, требующими обновлений.
Традиционные методы локализации кода
Традиционные методы в основном зависят от плотных моделей поиска или подходов на основе агентов, которые имеют свои ограничения. Плотный поиск требует встраивания всей кодовой базы в поисковое векторное пространство, что трудно поддерживать для больших репозиториев. С другой стороны, некоторые современные подходы используют модели на основе агентов, однако часто не понимают более глубокие семантические связи.
Решение LocAgent
Команда исследователей из различных университетов разработала LocAgent — фреймворк на основе графов для трансформации локализации кода. LocAgent преобразует кодовые базы в направленные гетерогенные графы, что позволяет агенту рассуждать на нескольких уровнях абстракции кода.
Преимущества LocAgent
LocAgent выполняет индексацию за считанные секунды и поддерживает использование в реальном времени, что делает его практичным для разработчиков и организаций. Модели LocAgent показали впечатляющие результаты на стандартных бенчмарках, достигнув 92.7% точности на уровне файлов.
Ключевые выводы
- LocAgent преобразует кодовые базы в гетерогенные графы для многопрофильного рассуждения.
- Достигнута точность до 92.7% на SWE-Bench-Lite.
- Сокращены затраты на локализацию кода примерно на 86% по сравнению с проприетарными моделями.
- Представлен новый набор данных Loc-Bench с 660 примерами.
- Модели Qwen2.5-7B и Qwen2.5-32B показали результаты сопоставимые с Claude-3.5.
- Инструменты типа TraverseGraph и SearchEntity оказались необходимыми.
- Повышена эффективность разрешения проблем на GitHub.
- Предлагает масштабируемое и экономичное решение по сравнению с проприетарными LLM.
Заключение
LocAgent предлагает эффективные и доступные решения для локализации кода и может стать ценным инструментом для организаций, стремящихся оптимизировать свои процессы разработки. Для получения дополнительной информации о том, как искусственный интеллект может улучшить ваши бизнес-процессы, свяжитесь с нами по адресу hello@itinai.ru.