Вышли обновленные версии моделей Command R (35B) и Command R+ (104B): две мощные языковые модели с 104B и 35B параметрами для мультиязычного искусственного интеллекта

 Updated Versions of Command R (35B) and Command R+ (104B) Released: Two Powerful Language Models with 104B and 35B Parameters for Multilingual AI

“`html

Cohere For AI представила два значительных достижения в области моделей искусственного интеллекта с выпуском моделей C4AI Command R+ 08-2024 и C4AI Command R 08-2024.

Обзор модели C4AI Command R+ 08-2024

Модель C4AI Command R+ 08-2024 представляет собой революционный прорыв в возможностях искусственного интеллекта. Она является исследовательским релизом с удивительными 104 миллиардами параметров. Модель оснащена Retrieval Augmented Generation (RAG) и продвинутыми функциями использования инструментов, позволяющими автоматизировать сложные многоэтапные задачи, такие как резюмирование, вопросно-ответные системы, рассуждения в различных контекстах и другие.

Одной из выдающихся особенностей модели C4AI Command R+ 08-2024 является ее многоязычная компетентность. Модель обучена на 23 языках, что позволяет ей обслуживать глобальную аудиторию и делает ее универсальным инструментом для международных приложений.

В архитектурном плане модель C4AI Command R+ 08-2024 является авторегрессионной языковой моделью, использующей оптимизированную трансформерную архитектуру. После начального предварительного обучения модель проходит надзорное дообучение и предпочтительное обучение для выравнивания своего поведения с человеческими предпочтениями, особенно в области полезности и безопасности.

Генерация на основе контекста и использование инструментов

Модель C4AI Command R+ 08-2024 специально разработана с возможностями генерации на основе контекста. Это означает, что модель может генерировать ответы, которые не только контекстуально точны, но и подтверждены конкретными фрагментами документов, предоставленными на этапе ввода. Эта способность критически важна для задач, требующих от модели производить обоснованные резюмирования или выполнять завершающий этап в RAG.

Возможности использования инструментов модели также являются областью ее превосходства. Она обучена обрабатывать разговорное использование инструментов, позволяя взаимодействовать с различными инструментами во время разговора.

Длина контекста и многоязычные возможности

Еще одной заметной особенностью модели C4AI Command R+ 08-2024 является поддержка обширной длины контекста в 128 тысяч токенов. Этот расширенный контекст позволяет модели поддерживать связность и актуальность в более длинных разговорах или документах, что делает ее полезной для задач, включающих обработку больших объемов информации или генерацию длинных выводов.

C4AI Command R 08-2024: Компактный компаньон

Вместе с моделью C4AI Command R+ 08-2024 Cohere также представила более компактную модель C4AI Command R 08-2024, содержащую 35 миллиардов параметров. Несмотря на свой меньший размер, модель C4AI Command R 08-2024 остается высокопроизводительной генеративной моделью с возможностями, аналогичными ее более крупному аналогу.

Приложения и последствия

Выпуск этих двух моделей от Cohere и Cohere For AI является значительным прорывом в исследованиях по искусственному интеллекту. Их открытый характер означает, что исследователи и разработчики по всему миру могут получить доступ к этим мощным инструментам для различных приложений, начиная от академических исследований до практических реализаций во многих отраслях, таких как финансы, здравоохранение и обслуживание клиентов.

Более того, продвинутые возможности использования инструментов и генерации на основе контекста модели C4AI Command R+ 08-2024 обещают быть особенно перспективными для задач, требующих высокой точности и контекстного понимания, например, в юридической или медицинской сферах.

Заключение

Выпуск моделей C4AI Command R+ 08-2024 и C4AI Command R 08-2024 от Cohere for AI представляет собой важный этап в развитии искусственного интеллекта. Эти модели предлагают беспрецедентные возможности генерации текста, рассуждения и поддержку многих языков, открывая новые возможности для автоматизации сложных задач через продвинутое использование инструментов.

Проверьте карту модели и детали. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter и присоединиться к нашему Telegram-каналу и группе в LinkedIn. Если вам нравится наша работа, вам понравится наш новостной бюллетень.

Не забудьте присоединиться к нашему подпишитесь на наш SubReddit.

Вот рекомендуемый вебинар от нашего спонсора: “Построение производительных приложений искусственного интеллекта с помощью NVIDIA NIMs и Haystack”.

Опубликовано на MarkTechPost.

“`

Полезные ссылки: