Mistral AI представила Pixtral Large: мультимодальная модель с 124 миллиардами параметров.

 Mistral AI Releases Pixtral Large: A 124B Open-Weights Multimodal Model Built on Top of Mistral Large 2

“`html

Искусственный интеллект: Новые возможности

В области искусственного интеллекта существует значительная задача — создание моделей, которые эффективно справляются с конкретными задачами и могут обрабатывать различные типы данных, такие как текст, изображения и аудио. Традиционные языковые модели достигли успеха в задачах обработки естественного языка, но часто не могут одновременно обрабатывать разные модальности.

Представляем Pixtral Large: Доступный многомодальный ИИ

Компания Mistral AI сделала важный шаг вперед, выпустив модель Pixtral Large с 124 миллиардами параметров. Эта многомодальная модель разработана на основе Mistral Large 2 и доступна с открытыми весами. Это делает передовой ИИ более доступным для широкого круга пользователей.

Технические подробности

Pixtral Large использует архитектуру трансформеров, адаптированную для интеграции данных разных типов. Модель имеет модульную архитектуру, что позволяет ей высококачественно обрабатывать запросы, основанные на текстах и изображениях. Исследователи могут настраивать модель под конкретные задачи.

Практические решения

Для эффективного использования Pixtral Large рекомендуется использовать библиотеку vLLM для создания рабочих процессов. Необходимо установить следующие версии:

  • vLLM версии 1.6.2 или выше;
  • mistral_common версии 1.4.4 или выше.

Пример использования модели:

from vllm import LLM
from vllm.sampling_params import SamplingParams

model_name = "mistralai/Pixtral-12B-2409"
sampling_params = SamplingParams(max_tokens=8192)
llm = LLM(model=model_name, tokenizer_mode="mistral")

prompt = "Опишите это изображение в одном предложении."
image_url = "https://picsum.photos/id/237/200/300"
messages = [
    {
        "role": "user",
        "content": [
            {"type": "text", "text": prompt},
            {"type": "image_url", "image_url": {"url": image_url}}
        ]
    },
]

outputs = llm.chat(messages, sampling_params=sampling_params)
print(outputs[0].outputs[0].text)

Значение и потенциальное влияние

Запуск Pixtral Large важен, так как открытые веса позволяют исследователям и стартапам проводить эксперименты, за меньшие деньги. Первые тесты показывают, что Pixtral демонстрирует лучшую точность в задачах, связанных с несколькими типами данных, по сравнению с предыдущими моделями.

Заключение

Запуск Pixtral Large от Mistral AI — это значительное достижение в многомодальном ИИ. Открытость модели способствует инклюзивности и инновациям в этой области. Это дает возможность различным организациям развивать креативные решения и эффективно решать сложные задачи.

Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, обращайтесь к нам за советом. Подписывайтесь на наши каналы для получения актуальной информации об ИИ и новых решениях.

“`

Полезные ссылки: