Новая семья моделей ‘Смеси агентов’ от OpenPipe: лучшие, чем GPT-4, по 25 раз дешевле

 OpenPipe Introduces a New Family of ‘Mixture of Agents’ MoA Models Optimized for Generating Synthetic Training Data: Outperform GPT-4 at 1/25th the Cost

“`html

Достижение превосходной производительности при низких затратах

Компания OpenPipe добилась значительных успехов в области искусственного интеллекта благодаря своей инновационной модели “Смесь Агентов” (MoA). Эта модель способна генерировать синтетические тренировочные данные и продемонстрировала впечатляющие результаты, будучи более экономичной альтернативой существующим моделям, в частности GPT-4.

Достижение впечатляющих результатов

Модели MoA от OpenPipe продемонстрировали впечатляющие результаты в жестких тестах, достигнув высоких показателей на платформах LMSYS Arena Hard Auto и AlpacaEval 2.0. Модель MoA набрала 84.8 на Arena Hard Auto и 68.4 на AlpacaEval 2.0, что свидетельствует о ее превосходной производительности в генерации высококачественных синтетических данных.

Сравнение с GPT-4

Модель MoA была протестирована в реальных сценариях по сравнению с различными вариантами GPT-4. Результаты показали, что модель MoA от OpenPipe была предпочтительнее GPT-4 в 59.5% задач, оцененных Claude 3 Opus. Это значительное достижение подчеркивает эффективность модели и ее практическую применимость в различных задачах, с которыми сталкиваются клиенты OpenPipe.

Эффективность в плане затрат и производительности

Одной из особенностей модели MoA является ее эффективность. Компания OpenPipe успешно настроила более маленькие модели типа Llama 3 с использованием синтетических данных, сгенерированных моделью MoA. Эти настроенные модели, такие как Llama 3 70B и Llama 3 8B, показали более высокие показатели, чем GPT-4 в нескольких задачах. Замечательно, что модель Llama 3 8B обеспечивает превосходную производительность в трех из четырех функций при значительно более низких затратах — в 25 раз дешевле и в три раза быстрее по сравнению с GPT-4.

Дизайн и реализация модели

Дизайн модели MoA является свидетельством инновационного подхода компании OpenPipe. Она является заменой для GPT-4 и совместима с различными базовыми моделями, включая GPT-4 Turbo и GPT-4o. Модель использует цепочку из трех запросов для генерации завершения: первый запрос генерирует три разнообразных варианта завершения, второй выявляет их проблемы, а третий комбинирует лучшие элементы каждого варианта для создания конечного вывода. Такой структурированный подход обеспечивает высококачественные и разнообразные ответы, улучшая производительность модели.

Оценка и проверка человеком

Компания OpenPipe провела обширные оценки для подтверждения производительности модели MoA. Помимо автоматизированных тестов, они привлекли человеческих оценщиков, чтобы убедиться, что выводы модели соответствуют человеческому суждению. Такой двойной подход, использующий как LLM в качестве судьи, так и человеческих оценщиков, обеспечил полную проверку модели, подтвердив ее превосходство над GPT-4 Turbo с разницей в 9%, даже после учета предпочтений людей.

Перспективы и доступность

Компания OpenPipe стремится к непрерывному совершенствованию и планирует выпустить улучшенные варианты модели MoA, включающие новые методики и модели. В настоящее время пользователи могут получить доступ к этим моделям через платформу OpenPipe, создав аккаунт и используя конечную точку чат-завершений, совместимую с OpenAI. Такая легкость доступа обеспечивает возможность получения преимуществ от прогресса в генерации синтетических данных, предлагаемого компанией OpenPipe.

Вывод

Модель “Смесь Агентов” от OpenPipe представляет собой значительный прорыв в области искусственного интеллекта, особенно в генерации высококачественных синтетических тренировочных данных при более низких затратах. Ее превосходная производительность, экономичность и инновационный дизайн делают ее ценным инструментом для практиков ИИ, стремящихся оптимизировать свои модели. Компания OpenPipe продолжает совершенствовать и расширять данную технологию, тем самым продвигая генерацию синтетических данных и настройку моделей.

“`

Note: The conversion is done in HTML using h3, h4, and p tags as per the provided instructions. If you need the content in a different format, please let me know.

Полезные ссылки: