Исследование Salesforce AI предлагает PerfCodeGen: систему без обучения, улучшающую качество кода, созданного ИИ, с помощью обратной связи о выполнении.

 Salesforce AI Research Proposes PerfCodeGen: A Training-Free Framework that Enhances the Performance of LLM-Generated Code with Execution Feedback

“`html

PerfCodeGen: Решение для повышения эффективности кода, генерируемого ИИ

Большие языковые модели (LLM) стали важными инструментами в разработке программного обеспечения. Они могут генерировать фрагменты кода, автоматизировать юнит-тесты и отлаживать код. Однако часто они не обеспечивают не только правильность, но и эффективность кода. Это может привести к плохой производительности программ, увеличению затрат и ухудшению пользовательского опыта. Особенно это касается менее опытных разработчиков, которые могут полагаться на код, предложенный ИИ, не понимая его последствий.

Что такое PerfCodeGen?

PerfCodeGen — это фреймворк от Salesforce AI, который улучшает как правильность, так и производительность кода, генерируемого LLM. Он не требует обучения и использует обратную связь для итеративного улучшения кода.

Как работает PerfCodeGen?

Фреймворк работает в два этапа:

  • Улучшение правильности: Сначала проверяется, соответствует ли сгенерированный код функциональным требованиям с помощью юнит-тестов.
  • Оптимизация производительности: После подтверждения правильности фокусируется на эффективности выполнения, оптимизируя код для наиболее ресурсоемких тестов.

Преимущества PerfCodeGen

PerfCodeGen интегрируется с существующими рабочими процессами LLM и использует несколько кандидатов для генерации решений. Он анализирует метрики выполнения, чтобы выявить узкие места и оптимизировать код. Это повышает вероятность создания эффективных программ.

Результаты тестирования

  • Эффективность выполнения: Оптимизация GPT-4 на HumanEval увеличилась с 24.54% до 28.83%.
  • Улучшение правильности: Уровень правильности GPT-3.5 на MBPP вырос с 66.38% до 73.36%.
  • Превосходство над эталоном: PerfCodeGen позволил LLM генерировать более эффективные решения в 55% задач HumanEval и 67% задач MBPP.
  • Масштабируемость: Открытые модели, такие как Phi-3-mini, показали производительность, сопоставимую с закрытыми моделями, такими как GPT-3.5 и GPT-4.

Заключение

PerfCodeGen предлагает практическое решение для одной из ключевых проблем современных LLM: их акцент на правильности в ущерб эффективности выполнения. Этот подход улучшает использование LLM в разработке программного обеспечения, позволяя разработчикам создавать более качественный код без необходимости в обширном переобучении.

Как внедрить ИИ в вашу компанию?

  • Проанализируйте, как ИИ может изменить вашу работу.
  • Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
  • Подберите подходящее решение и внедряйте ИИ постепенно.
  • На основе полученных данных расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам в Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.

Попробуйте AI Sales Bot — этот ИИ-ассистент в продажах помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru. Будущее уже здесь!

“`

Полезные ссылки: