“`html
Zyphra объявила о выпуске Zamba2-mini 1.2B – малой языковой модели нового поколения, предназначенной специально для приложений на устройствах.
Эта новая модель представляет собой веху в области искусственного интеллекта, объединяя передовую производительность с замечательной эффективностью, все это в компактном объеме памяти. Выход Zamba2-mini готов изменить ландшафт on-device AI, предлагая разработчикам и исследователям мощный инструмент для создания более отзывчивых, эффективных и способных приложений.
Производительность нового поколения в компактном исполнении
Zamba2-mini – последнее дополнение к инновационной серии Zamba от Zyphra, которая всегда находится во главе разработки малых языковых моделей. Несмотря на свои скромные размеры, Zamba2-mini достигает показателей производительности, сопоставимых с гораздо большими моделями, включая таких гигантов отрасли, как Gemma-2B от Google, SmolLM-1.7B от Huggingface, OpenELM-1.1B от Apple и Phi-1.5 от Microsoft. Особенно заметна превосходная производительность Zamba2-mini в задачах вывода, где она опережает конкурентов на 2x по времени до первого токена, на 27% по снижению избыточной памяти и на 1,29x по снижению задержки генерации по сравнению с моделями, такими как Phi3-3.8B.
Инновационный архитектурный дизайн
Архитектурные инновации, лежащие в основе Zamba2-mini, являются ключом к ее успеху. В своей основе Zamba2-mini использует основу слоев Mamba2, переплетенных с общими слоями внимания. Этот дизайн позволяет модели выделять больше параметров для своих основных операций, минимизируя затраты параметров благодаря общим блокам внимания. Эти блоки дополнительно усилены включением проекционных матриц LoRA, обеспечивающих дополнительную выразительность и специализацию каждого слоя без значительного увеличения общего количества параметров модели.
Доступность и перспективы в будущем
Zyphra обязалась сделать Zamba2-mini открытой моделью с лицензией Apache 2.0. Этот шаг соответствует более широкой миссии компании по предоставлению доступа к передовым технологиям искусственного интеллекта и поощрению инноваций в отрасли. Релиз модельных весов Zamba2-mini и интеграция с платформами, такими как Huggingface, позволяет многим разработчикам, исследователям и компаниям использовать возможности модели в своих проектах.
Открытый релиз Zamba2-mini ожидается стимулировать дальнейшие исследования и разработку эффективных языковых моделей. Zyphra уже утвердила себя как лидер в исследовании новаторских архитектур искусственного интеллекта, и релиз Zamba2-mini укрепляет ее позицию на передовой отрасли. Компания стремится к сотрудничеству с широким сообществом искусственного интеллекта, приглашая других исследовать уникальную архитектуру Zamba и вносить вклад в развитие эффективных базовых моделей.
Заключение
Zamba2-mini от Zyphra представляет собой значительный этап в разработке малых языковых моделей, особенно для приложений на устройствах, где эффективность и производительность имеют первостепенное значение. Благодаря своей передовой архитектуре, тщательному процессу обучения и доступности в открытом доступе, Zamba2-mini готова стать ключевым инструментом для разработчиков и исследователей, стремящихся расширить возможности on-device AI.
“`