Выпущены высокопроизводительные SLM (маленькие языковые модели), специально обученные для задач RAG, стоимостью менее $25 каждая

Itinai.com it company office background blured chaos 50 v d206c24f 918d 4335 b481 4a9e0737502d 0

«`html

BRAG: высокопроизводительные модели SLM (малых языковых моделей), специально обученные для задач RAG за менее чем $25 каждая

BRAG — это серия высокопроизводительных моделей Retrieval Augmented Generation (RAG), разработанных исследователями Maximalists AI. Модели BRAG — это семейство малых языковых моделей, разработанных для предложения экономичных и высокопроизводительных альтернатив в области обработки языка с использованием искусственного интеллекта.

Практические решения и ценность

BRAG были созданы как эффективные и высокопроизводительные языковые модели, которые не требуют обширных вычислительных ресурсов, типичных для масштабных моделей, таких как модели от Nvidia и OpenAI. Основной мотивацией для создания BRAG было разработать серию моделей, способных соответствовать или превзойти производительность ведущих моделей, таких как Cohere’s Command R+, Qwen2, Llama3.1 и Llama3 Instruct, при минимальных затратах на обучение.

Серия BRAG включает четыре модели:

BRAG-Qwen2-7b-v0.1
BRAG-Llama-3.1-8b-v0.1
BRAG-Llama-3-8b-v0.1
BRAG-Qwen2-1.5b-v0.1

Эти модели были выбраны на основе их производительности в открытых бенчмарках и способности сбалансировать эффективность и возможности.

Модели BRAG характеризуются отличной производительностью относительно их размера. Модели 1.5 миллиарда параметров предлагают отличный баланс производительности и эффективности. Модели 7 и 8 миллиардов параметров способны решать более сложные задачи, такие как понимание длинного контекста, интерпретация табличных данных и математическое рассуждение.

Обучение моделей BRAG включало в себя техники Low-Rank Adaptation (LoRA) и квантование LoRA (QLoRA). Техника LoRA позволяет более быстрое обучение с сниженными вычислительными затратами за счет упрощения матриц адаптации. В свою очередь, QLoRA сжимает параметры весов до 4-битной точности, что значительно сокращает объем памяти и облегчает обучение на видеокартах для потребителей.

Модели были оценены с использованием ChatRAG-Bench, бенчмарка, разработанного для оценки возможностей конверсационного вопросно-ответного (QA) и RAG на различных типах документов и форматах вопросов. Метриками оценки были использованы F1-мера и точность Exact Match, которые предоставили представление о способности моделей генерировать точные и контекстуально актуальные ответы.

В процессе обучения возникли несколько вызовов, таких как обработка длинных документов, интерпретация табличных данных и обработка доменно-специфических запросов. Эти проблемы были решены путем тщательного выбора наборов данных и экспериментов с различными их комбинациями. Например, включение наборов данных, таких как DROP, Quoref и SQuAD, помогло улучшить способности моделей в обработке сложных и разнообразных типов данных. Метрика F1-меры, хотя и широко принята, обнаружено имеет ограничения в улавливании семантических нюансов и контекста. Это подчеркивает необходимость более всесторонних и контекстно-ориентированных метрик оценки для более точной оценки производительности модели.

В заключение, Maximalists планируют улучшить модели BRAG, улучшив производительность RAG и обработку табличных данных, а также ввести генерацию ссылок для лучшей интерпретируемости. Они также стремятся совершенствовать техники переписывания запросов для улучшения точности и актуальности поиска. Разработка BRAG поддерживалась за счет кредитов от Modal Labs, что способствовало экономичным экспериментам. С использованием инновационных методов обучения и стратегического выбора моделей BRAG продемонстрировали, что высокая производительность может быть достигнута с минимальными затратами на ресурсы, что открывает путь для более доступных и эффективных решений в области искусственного интеллекта.

Подробности и модели можно посмотреть здесь.

Вся заслуга за этот исследовательский проект принадлежит исследователям. Также не забудьте подписаться на наш Twitter и присоединиться к нашей группе в LinkedIn. Если вам нравится наша работа, вам понравится и наша рассылка.

Не забудьте присоединиться к нашему сообществу в 47k+ ML SubReddit.

Посмотрите предстоящие вебинары по ИИ здесь.

Этот пост был опубликован первоначально на MarkTechPost.

«`

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Сотрудничество

Бесплатный ИИ текст генератор

Спросить ИИ чат

Заказать разработку

05.08.2024

Владимир Дьячков PhD

Лучшие ИИ

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

02.05.2024

Лучшие ИИ

Улучшение задач рассуждения в языковых моделях с помощью итеративной оптимизации предпочтений

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
21.05.2025

Бесплатный ИИ

Как организовать сбор дефектов в формате RCA: ИИ предложит шаблон анализа корневых причин

Как работает чатбот и как им пользоваться Чатбот на этой странице — ваш личный помощник для автоматизации анализа дефектов. Просто опишите ситуацию: «На производстве появилась трещина в корпусе…

Менеджер по качеству
21.05.2025

Бесплатный ИИ

Как сформулировать план управления ключевым риском: ИИ предложит сценарии реагирования и KPI

Сегодня каждый бизнес сталкивается с рисками, которые могут остановить процессы, сорвать сделки или привести к финансовым потерям. Но как быстро и без лишней рутины разработать эффективный план реагирования?…

Риск-менеджер
06.05.2025

Медицинские ИТ

Инструмент для анализа данных о телемедицинских консультациях

Сколько стоит разработка инструмента для анализа данных о телемедицинских консультациях: самостоятельный путь vs готовое решение от itinai.ru Введение: Выбор, который определяет будущее бизнеса Телемедицина в России активно развивается,…

Python
21.10.2024

Лучшие ИИ

Сравнение методов объединения и смешивания данных для создания эффективных ИИ-моделей.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
26.08.2024

Лучшие ИИ

Оценка влияния методов подсказок и предметных знаний на бенчмаркинг больших языковых моделей в биомедицинской классификации и распознавании именованных сущностей

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
03.04.2024

Лучшие ИИ

Исследователи из Университета Глазго предлагают поверхностные кросс-кодеры в качестве решения на основе искусственного интеллекта для быстрого поиска информации с низкой задержкой.

AI tools, AI Новости, Innovation, LLM, ИИ
11.12.2024

Лучшие ИИ

LG AI Research представила EXAONE 3.5: три открытых двуязычных модели ИИ для выдающегося понимания инструкций и длинного контекста.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

Выпущены высокопроизводительные SLM (маленькие языковые модели), специально обученные для задач RAG, стоимостью менее $25 каждая

BRAG: высокопроизводительные модели SLM (малых языковых моделей), специально обученные для задач RAG за менее чем $25 каждая

Практические решения и ценность

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

Продажа цифровых продуктов через AI-платформу

Как блогеру о психологии начать зарабатывать

Монетизация AI в нише репетиторства по английскому

Монетизация блога по саморазвитию через AI

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Агент по автоматизации юридических процессов : подготовка шаблонных документов

ИИ-Специалист по автоматизации интеграции систем : настройка API и потоков данных

ИИ-Специалист по обучению сотрудников : персонализация обучающих материалов

ИИ-Агент по обработке клиентских запросов : автоматизация поддержки и анализа диалогов

Как составить Use Case по стандарту UML 2.5: ИИ предложит акторов, шаги сценария и исключения

Как быстро описать бизнес-правила в системе: ИИ создаст логические условия и исключения

Как сравнить альтернативные инвестиции: ИИ рассчитает NPV и IRR по каждому варианту

Как подготовить офис к проверке: искусственный интеллект составит чек-лист для администратора

Как юристу оформить доверенность от имени компании: ИИ сформирует шаблон с учетом полномочий

Как обработать входящее обращение по шаблону: искусственный интеллект подскажет универсальный текст ответа

Лучший ИИ онлайн

Улучшение задач рассуждения в языковых моделях с помощью итеративной оптимизации предпочтений

Как организовать сбор дефектов в формате RCA: ИИ предложит шаблон анализа корневых причин

Как сформулировать план управления ключевым риском: ИИ предложит сценарии реагирования и KPI

Инструмент для анализа данных о телемедицинских консультациях

Сравнение методов объединения и смешивания данных для создания эффективных ИИ-моделей.

LG AI Research представила EXAONE 3.5: три открытых двуязычных модели ИИ для выдающегося понимания инструкций и длинного контекста.

Доступность

Политика конфиденциальности

FAQ

Новости

Отказ от ответственности

Пресс-релизы