Scale AI предлагает PlanSearch: новый метод вычислений во время тестирования для улучшения разнообразия и эффективности генерации кода больших языковых моделей.

 Scale AI Proposes PlanSearch: A New SOTA Test-Time Compute Method to Enhance Diversity and Efficiency in Large Language Model Code Generation

“`html

Large Language Models (LLMs) в области генерации кода

Проблема разнообразия решений и практические решения

Модели больших языковых моделей (LLMs) значительно продвинулись в различных областях, включая понимание естественного языка и генерацию кода. Однако они сталкиваются с вызовами при применении в более специализированных областях, таких как соревновательное программирование и генерация кода. В этой области ключевое внимание уделяется улучшению способности моделей генерировать разнообразные и точные решения для задач кодирования, более эффективного использования вычислительной мощности во время вывода. Это критически важно для приложений, где LLMs должны предоставлять несколько высококачественных решений для одной проблемы, например, в средах соревновательного программирования.

Проблема разнообразия в решениях, вызовы и решения

Одной из основных проблем в генерации кода на основе LLM является необходимость в большем разнообразии сгенерированных решений. При попытке разработать несколько потенциальных ответов на задачу кодирования эти модели часто производят очень похожие выводы, даже если они неверны. Это ограничивает способность моделей исследовать альтернативные подходы и влияет на их общую производительность. Эта проблема в основном связана с посттренировочными целями, которые зачастую приводят к тому, что модели сосредотачиваются на создании одного “правильного” ответа, что снижает их способность генерировать разнообразные и креативные решения.

Новый метод PlanSearch и его эффективность

Исследователи из Scale AI, California Institute of Technology, Northeastern University и Cursor AI представили новый метод под названием PlanSearch. Этот подход направлен на увеличение разнообразия решений путем поиска в “пространстве идей” естественного языка перед генерацией кода. PlanSearch создает различные высокоуровневые наблюдения и эскизы о проблеме, которые затем объединяются в различные планы для решения задачи. Этот метод позволяет LLM исследовать более широкий спектр возможностей и генерировать более разнообразные решения. Путем формулирования проблемы на естественном языке PlanSearch позволяет модели обдумать различные стратегии перед принятием окончательного решения, увеличивая шансы на успех.

… (продолжение текста)

Выводы и практическая польза

В заключение, PlanSearch решает ключевое ограничение в генерации кода на основе LLM: необходимость в большем разнообразии решений. Путем переноса процесса поиска в пространство идей естественного языка техника поощряет исследование более широкого спектра стратегий, что приводит к более точным и разнообразным результатам. Этот подход значительно улучшил производительность по нескольким бенчмаркам, достигнув pass@200 на уровне 77% на LiveCodeBench и более 90% на других задачах кодирования. Помимо улучшения разнообразия и эффективности, PlanSearch представляет собой значительное достижение в генерации кода на основе LLM, предлагая многообещающее решение для генерации точных и разнообразных выводов в сложных средах кодирования.

Проверьте ссылку на статью. Вся заслуга за этот исследовательский проект принадлежит исследователям. Также не забывайте следить за нами в Twitter и LinkedIn. Присоединяйтесь к нашему Telegram-каналу.

Если вам понравилась наша работа, вам понравится наш рассылка.

Не забудьте присоединиться к нашему сообществу Reddit.

Ознакомьтесь с AI Sales Bot здесь. Этот AI-ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab по ссылке itinai.ru. Будущее уже здесь!

“`

Полезные ссылки: