✅ Databricks представили публичный превью фреймворка Mosaic AI Agent и оценки агента.

«`html

Databricks объявила о публичном предпросмотре Mosaic AI Agent Framework и Agent Evaluation

Недавно Databricks объявила о публичном предпросмотре Mosaic AI Agent Framework и Agent Evaluation в рамках мероприятия Data + AI Summit 2024. Эти инновационные инструменты направлены на помощь разработчикам в создании и развертывании высококачественных приложений Agentic и Retrieval Augmented Generation (RAG) на платформе Data Intelligence от Databricks.

Проблемы при создании высококачественных генеративных приложений ИИ

Создание концепции генеративных приложений ИИ относительно просто. Однако разработка высококачественного приложения, соответствующего строгим стандартам для решений, предназначенных для клиентов, требует времени и усилий. Разработчики часто сталкиваются с проблемами:

Выбор правильных метрик для оценки качества приложения.
Эффективное сбор человеческой обратной связи для измерения качества.
Выявление корневых причин проблем с качеством.
Быстрая итерация для улучшения качества приложения до развертывания в продакшн.

Введение Mosaic AI Agent Framework и Agent Evaluation

Mosaic AI Agent Framework и Agent Evaluation решают эти проблемы через несколько ключевых возможностей:

Интеграция человеческой обратной связи: Agent Evaluation позволяет разработчикам определять высококачественные ответы для своих генеративных приложений ИИ, приглашая экспертов по предмету из своей организации для обзора и предоставления обратной связи, даже если они не являются пользователями Databricks. Этот процесс помогает собирать разнообразные точки зрения и идеи для улучшения приложения.
Комплексные метрики оценки: Agent Evaluation предлагает набор метрик для измерения качества приложения, разработанный в сотрудничестве с Mosaic Research. Эти метрики включают точность, галлюцинации, вредоносность и полезность. Система автоматически регистрирует ответы и обратную связь в таблице оценки, облегчая быстрый анализ и выявление потенциальных проблем с качеством. AI-судьи, калиброванные с использованием обратной связи экспертов, оценивают ответы, чтобы выявить корневые причины проблем.
Рабочий процесс разработки end-to-end: Интегрированный с MLflow, Agent Framework позволяет разработчикам регистрировать и оценивать генеративные приложения ИИ с использованием стандартных API MLflow. Эта интеграция поддерживает плавные переходы от разработки к продакшну, обеспечивая непрерывные циклы обратной связи для улучшения качества приложения.
Управление жизненным циклом приложения: Agent Framework предоставляет упрощенный SDK для управления жизненным циклом агентных приложений, от управления разрешениями до развертывания с использованием Mosaic AI Model Serving. Эта комплексная система управления обеспечивает масштабируемость и поддержание высокого качества приложений на протяжении их жизненного цикла.

Построение высококачественного RAG-агента

Для иллюстрации возможностей Mosaic AI Agent Framework Databricks предоставила пример создания высококачественного RAG-приложения. Этот пример включает создание простого RAG-приложения, которое извлекает соответствующие фрагменты из заранее созданного векторного индекса и подводит их в ответ на запросы. Процесс включает подключение к векторному поисковому индексу, установку индекса в ретриевер LangChain и использование MLflow для включения трассировок и развертывания приложения. Этот рабочий процесс демонстрирует простоту создания, оценки и улучшения генеративных приложений ИИ с использованием инструментов Mosaic AI.

Прикладные решения и отзывы

Несколько компаний успешно реализовали Mosaic AI Agent Framework для улучшения своих генеративных приложений ИИ. Например, Corning использовала фреймворк для создания исследовательского ассистента ИИ, индексирующего сотни тысяч документов, что значительно улучшило скорость извлечения, качество ответов и точность. Lippert использовала фреймворк для оценки результатов своих генеративных приложений ИИ, обеспечивая точность и контроль данных. FordDirect интегрировала фреймворк для создания единого чат-бота для своих дилерских центров, облегчая оценку производительности и взаимодействие с клиентами.

Ценообразование и следующие шаги

Ценообразование для Agent Evaluation основано на запросах судей, в то время как Mosaic AI Model Serving ценообразование происходит в соответствии с тарифами Mosaic AI Model Serving. Databricks призывает клиентов опробовать Mosaic AI Agent Framework и Agent Evaluation, получив доступ к различным ресурсам, таким как документация по Agent Framework, демонстрационные блокноты и Generative AI Cookbook. Эти ресурсы предоставляют подробное руководство по созданию генеративных приложений ИИ высокого качества от концепции до развертывания.

В заключение, объявление Databricks о Mosaic AI Agent Framework и Agent Evaluation представляет собой значительный прогресс в области генеративного ИИ. Эти инструменты предоставляют разработчикам необходимые возможности для эффективного создания, оценки и развертывания высококачественных генеративных приложений ИИ. Решая общие проблемы и предлагая комплексную поддержку, Databricks дает разработчикам возможность создавать инновационные решения, соответствующие высочайшим стандартам качества и производительности.

«`

Databricks представили публичный превью фреймворка Mosaic AI Agent и оценки агента.

Databricks объявила о публичном предпросмотре Mosaic AI Agent Framework и Agent Evaluation

Проблемы при создании высококачественных генеративных приложений ИИ

Введение Mosaic AI Agent Framework и Agent Evaluation

Построение высококачественного RAG-агента

Прикладные решения и отзывы

Ценообразование и следующие шаги

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

AI-помощник для дизайнера-фрилансера

AI в нише животных — бизнес для зоомагазина и блогера

Монетизация блога по саморазвитию через AI

Использование AI для специалистов по питанию

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Аналитик конкурентов : мониторинг цен и позиционирования

ИИ-Специалист по автоматизации технической поддержки : диагностика и решение проблем

ИИ-Агент для управления проектами : планирование и контроль сроков

ИИ-Агент по автоматизации отчетности : генерация финансовых и операционных отчетов

Как готовиться к встрече с ЛПР: искусственный интеллект составит план вопросов и аргументов

Как оператору вести опрос по сценарию без ошибок: искусственный интеллект сгенерирует список уточняющих вопросов

Как составить обучающий курс в формате микрообучения: ИИ предложит сценарий, формат и контроль знаний

Как написать тест-кейсы по спецификации: ИИ сгенерирует до 10 кейсов по описанию фичи

Как отработать “мне не интересно”: искусственный интеллект предложит 5 фраз под конкретный продукт

Как быстро оформить протокол совещания: ИИ предложит структуру и шаблон под формат встречи

Лучший ИИ онлайн

Игровые движки на нейронных сетях: новая технология от Google.

Энергетические трансформеры: новый уровень машинного обучения для сложного мышления

Оптимизация Политики Контроля Длины: Повышение Эффективности Моделей Рассуждений

Знакомьтесь с SynPO: Новый подход, использующий синтетические данные предпочтений для настройки моделей.

Использование квантового машинного обучения для ускорения анализа сигналов ЭЭГ

Good Fire AI выпустила открытый код разреженных автокодировщиков для Llama 3.1 8B и Llama 3.3 70B

Проект Omost: преобразование возможностей LLM для создания изображений

Доступность

Реклама

Партнеры

Авторские права

Политика комментариев

Редакционная политика