Nomic: Новый Мультимодальный Модель Встраивания для Эффективного Поиска Документов

Открытие Nomic: Модель мультимодальных встраиваний последнего поколения

Nomic объявила о запуске своей новейшей модели встраиваний, которая демонстрирует выдающиеся результаты в задачах поиска визуальных документов. Новая модель обрабатывает текст, изображения и скриншоты в одном потоке, устанавливая новый рекорд на бенчмарке Vidore-v2 для поиска визуальных документов. Это достижение особенно важно для приложений, использующих дополненное извлечение (RAG) с PDF-документами, где требуется одновременное захватывание визуального и текстового контекста.

Новые горизонты в поиске визуальных документов

Модель Nomic Embed Multimodal 7B достигла впечатляющего результата 62.7 NDCG@5 на бенчмарке Vidore-v2, что на 2.8 пункта выше предыдущих лучших моделей. Это достижение является важной вехой в развитии мультимодальных встраиваний для обработки документов.

В отличие от традиционных систем поиска, которые в основном полагаются на извлечённый текст и часто упускают важные визуальные элементы, новая модель Nomic захватывает всю полноту документов, интегрируя текстовые и визуальные компоненты напрямую. Это устраняет необходимость в сложных и подверженных ошибкам процессах, используемых в анализе документов.

Решение реальных задач документирования

Документы по своей природе мультимодальны, передавая информацию через текст, графики, макеты страниц, таблицы и даже шрифты. Традиционные системы, работающие только с текстом, сталкиваются с этой сложностью, часто требуя отдельных кодировщиков для визуального и текстового ввода или сложных предварительных процессинговых конвейеров.

Nomic Embed Multimodal предлагает элегантное решение, поддерживая комбинированные текстовые и визуальные входные данные в одной модели, что идеально подходит для:

  • PDF-документов и научных статей
  • Скриншотов приложений и веб-сайтов
  • Визуально насыщенного контента, где важен макет
  • Многоязычных документов, где важен визуальный контекст

Комплексная экосистема встраиваний

С выходом Nomic Embed Multimodal, Nomic завершила создание комплексного набора моделей встраиваний, демонстрирующих выдающиеся результаты в различных областях:

  • Nomic Embed Multimodal: последняя модель, достигающая выдающихся результатов в обработке комбинированных текстов, изображений и скриншотов. Идеально подходит для рабочих процессов поиска документов.
  • Nomic Embed Text v2: мощная многоязычная модель для встраивания текста, достигающая выдающихся результатов на бенчмарке MIRACL. Идеально подходит для рабочих процессов поиска текста на любом языке.
  • Nomic Embed Code: модель встраивания, специализированная для приложений поиска кода, достигающая выдающихся результатов на бенчмарке CodeSearchNet. Идеально подходит для приложений для работы с кодом.

Эта полная экосистема предоставляет разработчикам современные инструменты для обработки различных типов данных, от чистого текста до сложных мультимодальных документов и специализированных репозиториев кода. Каждая модель в экосистеме разработана для бесшовной работы с современными рабочими процессами, обеспечивая выдающуюся производительность в своей области.

Доступность

Nomic сделала свои мультимодальные модели встраиваний доступными на платформе, а также соответствующий набор данных, что делает эту передовую технологию доступной для исследователей и разработчиков по всему миру.

Этот релиз представляет собой значительный шаг вперед в области мультимодального представления и понимания документов, завершая видение Nomic по предоставлению лучших решений для встраивания на всем спектре модальностей данных.

Доступность ожидается на платформе (Nomic Atlas Data and Embedding Platform).

Как искусственный интеллект может изменить ваш подход к работе

Рассмотрите возможность автоматизации процессов. Найдите моменты взаимодействия с клиентами, где искусственный интеллект может добавить наибольшую ценность.

Определите важные ключевые показатели эффективности (KPI), чтобы убедиться, что ваши инвестиции в ИИ действительно имеют положительное влияние на бизнес.

Выберите инструменты, которые соответствуют вашим потребностям и позволяют настраивать их в соответствии с вашими целями.

Начните с небольшого проекта, соберите данные о его эффективности, а затем постепенно расширяйте использование ИИ в своей работе.

Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей ИИ, подписывайтесь на наш Telegram https://t.me/itinai.

Посмотрите практический пример решения на основе ИИ: бот для продаж от https://itinai.ru/aisales, предназначенный для автоматизации взаимодействия с клиентами круглосуточно и управления взаимодействиями на всех этапах пути клиента.

Новости в сфере искусственного интеллекта