Новый оптимизатор MIPRO лучше базовых моделей на пяти из шести разнообразных языковых моделях с точностью 12,9% using a best-in-class open-source model (Llama-3-8B) 🚀

 MIPRO: A Novel Optimizer that Outperforms Baselines on Five of Six Diverse Language Model LM Programs Using a Best-in-Class Open-Source Model (Llama-3-8B) by 12.9% accuracy

“`html

Оптимизация языковых моделей с помощью MIPRO

Языковые модели (LM) значительно улучшили сложные задачи обработки естественного языка (NLP) благодаря сложным техникам подсказок и многоступенчатым конвейерам. Однако проектирование этих программ LM сильно зависит от ручной “инженерии подсказок”, что является трудоемким процессом создания длинных подсказок методом проб и ошибок. Этот подход сталкивается с проблемами, особенно в многоступенчатых программах LM, где часто отсутствуют золотые метки или метрики оценки для отдельных вызовов LM. Отсутствие этих метрик затрудняет оценку и оптимизацию каждого этапа независимо, что затрудняет общую эффективность и эффективность программ LM. В результате существует настоятельная необходимость в более систематических и автоматизированных подходах к оптимизации многоступенчатых конвейеров LM.

Оптимизация программ LM с помощью MIPRO

Исследователи предлагают надежный подход к оптимизации подсказок для программ LM, сосредотачиваясь на максимизации метрик без необходимости меток или градиентов на уровне модулей. Их метод, называемый MIPRO, факторизует проблему оптимизации, разрабатывая свободные инструкции и несколько демонстраций для каждого модуля в программе LM. MIPRO использует несколько инновационных стратегий для преодоления вызовов оптимизации подсказок в многоступенчатых конвейерах. Это включает программно- и данных-ориентированные техники для генерации эффективных инструкций, стохастическую мини-пакетную функцию оценки для обучения замещающей модели цели и процедуру мета-оптимизации, которая улучшает конструирование предложений LM со временем. Этот комплексный подход позволяет MIPRO эффективно навигировать по сложному ландшафту оптимизации многоступенчатых программ LM.

Результаты оптимизации MIPRO

Результаты подхода оптимизации MIPRO показывают несколько ключевых идей. Оптимизация бутстрапированных демонстраций в качестве нескольких примеров оказалась решающей для достижения лучшей производительности в большинстве задач. MIPRO, который оптимизирует как инструкции, так и несколько демонстраций, в целом дал лучшую производительность по всем задачам. Оптимизация инструкций оказалась особенно важной для задач с условными правилами, которые не являются немедленно очевидными для LM и не могут быть легко выражены ограниченным количеством нескольких примеров. Техники опоры в целом оказались полезными для предложений инструкций, хотя лучшая стратегия предложения варьировалась в зависимости от задачи.

Это исследование формализует оптимизацию программ LM как проблему поиска подсказок, решая вызовы генерации предложений и кредитного ассигнования. Исследование демонстрирует, что оптимизация нескольких демонстраций является очень эффективной, а оптимизация инструкций критична для сложных задач. Исследование в конечном итоге показывает, что совместная оптимизация как демонстраций, так и инструкций дает лучшие результаты, открывая путь к более эффективным и мощным многоступенчатым программам LM.

Подробнее о статье можно узнать здесь.

Все права на это исследование принадлежат его авторам. Также не забудьте подписаться на наш Twitter.

Присоединяйтесь к нашему каналу в Telegram и группе в LinkedIn.

Если вам понравилась наша работа, вам понравится и наша рассылка.

Не забудьте присоединиться к нашему сообществу в Reddit с более чем 45 тыс. участников.

Источник: MarkTechPost.

Применение искусственного интеллекта в вашем бизнесе

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте MIPRO: A Novel Optimizer that Outperforms Baselines on Five of Six Diverse Language Model LM Programs Using a Best-in-Class Open-Source Model (Llama-3-8B) by 12.9% accuracy.

Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI.

Определитесь какие ключевые показатели эффективности (KPI): вы хотите улучшить с помощью ИИ.

Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI.

На полученных данных и опыте расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.

Попробуйте AI Sales Bot здесь. Этот AI ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!

“`

Полезные ссылки: