Новая языковая модель GLM-4-9B-Chat-1M университета Цинхуа: конкурент GPT-4V, Gemini Pro, Mistral и Llama 3 8B

 Meet Tsinghua University’s GLM-4-9B-Chat-1M: An Outstanding Language Model Challenging GPT 4V, Gemini Pro (on vision), Mistral and Llama 3 8B

“`html

Встречайте GLM-4 9B: мощная модель языка от университета Цинхуа

Группа знаний университета Цинхуа представила GLM-4 9B – мощную новую модель языка, превосходящую GPT-4 и Gemini в различных тестах. Разработанная командой Tsinghua Deep Model (THUDM), эта открытая модель является значительным достижением в области обработки естественного языка.

Ключевые особенности модели GLM-4 9B:

GLM-4 9B – масштабная модель языка, обученная на 10 триллионах токенов в 26 языках. Она способна выполнять множество функций, включая многократный диалог на китайском и английском, выполнение кода, веб-просмотр и вызов пользовательских инструментов через Function Call.

Архитектура модели использует передовые методики глубокого обучения, включая механизмы внимания и трансформерные архитектуры. Это обеспечивает поддержку контекстного окна до 128 000 токенов, а специализированный вариант позволяет использовать впечатляющую длину контекста в 1 миллион токенов.

По сравнению с GPT и Gemini, архитектура GLM-4 9B выделяется поддержкой задач высокого разрешения (до 1198 х 1198 пикселей) и способностью работать с разнообразными языками, что делает ее мощным инструментом в области моделей языка.

Оценки на различных наборах данных показали превосходную производительность GLM-4 9B во многих областях, а также равную лучшим моделям по некоторым задачам, причем модель превзошла все другие существующие модели по общей точности, включая GPT-4, Gemini Pro (в задачах зрения), Mistral и Llama 3 8B.

Благодаря своему открытому характеру и коммерческому использованию (при определенных условиях), GLM-4 9B предоставляет множество возможностей для разработчиков, исследователей и бизнеса. Потенциальные приложения модели варьируются от обработки естественного языка до компьютерного зрения, генерации кода и многого другого.

Выпуск GLM-4 9B университетом Цинхуа представляет значительный шаг в моделях языка. Ее впечатляющая производительность, мультиязычные возможности и универсальная архитектура устанавливают новый стандарт для открытых моделей языка и заложат путь для дальнейших достижений в области обработки естественного языка и искусственного интеллекта.

Посмотреть модель на странице HF.

Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на нашу страницу в Twitter. Присоединяйтесь к нашему Telegram-каналу, каналу в Discord и группе в LinkedIn.

Если вам понравилась наша работа, вам понравится и наша рассылка.

Не забудьте присоединиться к нашему сообществу ML SubReddit с 43 тыс. подписчиков. Также ознакомьтесь с нашей платформой AI Events.

Оригинальная статья: “Meet Tsinghua University’s GLM-4-9B-Chat-1M: An Outstanding Language Model Challenging GPT 4V, Gemini Pro (on vision), Mistral and Llama 3 8B” на сайте MarkTechPost.


“`

Полезные ссылки: