Вышел новый текстовый модельный алгоритм с улучшенной компрессией и производительностью.

 Snowflake-Arctic-Embed-m-v1.5 Released: A 109M Parameters Groundbreaking Text Embedding Model with Enhanced Compression and Performance Capabilities

“`html

Snowflake-Arctic-Embed-m-v1.5: Улучшенная модель текстовых вложений

Snowflake недавно объявила о выпуске обновленной модели вложения текста snowflake-arctic-embed-m-v1.5. Эта модель генерирует высококомпрессионные векторы вложения, сохраняя при этом высокую производительность. Самая значительная особенность модели заключается в ее способности производить векторы вложения, сжатые до 128 байтов за вектор, не потеряв при этом существенного качества.

Технические характеристики

Модель snowflake-arctic-embed-m-v1.5 обладает 109 миллионами параметров и использует 256-мерные векторы по умолчанию, которые могут быть дополнительно усечены и квантованы для конкретных случаев использования. Эта адаптивность делает ее привлекательным вариантом для приложений, где эффективная обработка текста критически важна, от поисковых систем до систем рекомендаций.

Оценка результатов

Результаты оценки snowflake-arctic-embed-m-v1.5 показывают, что модель поддерживает высокие метрики производительности по различным бенчмаркам. Например, модель достигает среднего показателя восстановления 55.14 на бенчмарке MTEB (Massive Text Embedding Benchmark) Retrieval при использовании 256-мерных векторов, превосходя несколько других моделей, обученных с аналогичными целями.

Использование и развертывание

Кроме того, snowflake-arctic-embed-m-v1.5 может быть использована в различных средах, включая серверные инференс API и выделенные конечные точки инференса. Эта гибкость обеспечивает масштабирование модели в соответствии с конкретными потребностями и инфраструктурой пользователя, будь то небольшое приложение или предприятие большого уровня.

Заключение

Модель snowflake-arctic-embed-m-v1.5 выделяется как доказательство экспертизы и видения компании Snowflake Inc. Внедрение этой инновационной модели с высокой производительностью делает ее ценным активом для разработчиков и исследователей, стремящихся усовершенствовать свои приложения с помощью передовых возможностей обработки естественного языка.

Подробнее ознакомиться с исследованием можно здесь.

Вся заслуга за это исследование принадлежит исследователям этого проекта.

Не забудьте подписаться на наш Twitter.

“`

Полезные ссылки: