Ученые Пекинского университета разработали новый стандарт для оценки числового понимания в больших языковых моделях.

 Researchers at Peking University Introduce A New AI Benchmark for Evaluating Numerical Understanding and Processing in Large Language Models

“`html

Новые подходы к оценке числового понимания в больших языковых моделях

Большие языковые модели (БЯМ) произвели революцию в области искусственного интеллекта, но сталкиваются с проблемами в базовом числовом понимании. Это важно для более сложных математических задач.

Проблемы числового понимания

БЯМ часто ошибаются в числовых задачах, что снижает их надежность. Например, они могут неверно сравнивать числа или допускать ошибки в простых арифметических операциях. Это указывает на необходимость улучшения их числовых навыков.

Специальные методики оценки

Исследователи из Пекинского университета разработали новый стандарт для оценки числового понимания БЯМ. Он охватывает различные числовые форматы, такие как целые числа, дроби и научная нотация. Это позволяет более точно оценивать, как модели справляются с числовыми задачами.

Методы улучшения

Для оценки числового понимания использовались специальные токенизаторы и методы позиционного кодирования. Это помогает моделям лучше обрабатывать более длинные числа без потери точности.

Результаты исследования

Исследования показали, что модели, такие как GPT-4o, хорошо справляются с простыми задачами, но их точность резко падает при увеличении сложности. Например, точность в сложных задачах может упасть до 15%.

Заключение

Работа команды Пекинского университета подчеркивает необходимость улучшения методик и данных для обучения, чтобы повысить числовое понимание в БЯМ. Это создаст надежные решения для реальных приложений.

Если вы хотите развивать свою компанию с помощью ИИ, проанализируйте, как ИИ может изменить вашу работу и определить ключевые показатели эффективности (KPI). Начните с небольших проектов и постепенно расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.

Попробуйте AI Sales Bot — этот AI ассистент в продажах помогает отвечать на вопросы клиентов и снижает нагрузку на команду.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab — будущее уже здесь!

“`

Полезные ссылки: