AMD выпустила ROCm 6.3: открытая платформа с инструментами для улучшения ИИ, машинного обучения и высокопроизводительных вычислений.

 AMD Releases AMD ROCm 6.3: An Open-Source Platform with Advanced Tools and Optimizations to Enhance AI, ML, and HPC Workloads

“`html

Искусственный интеллект и его вызовы

Искусственный интеллект (ИИ), машинное обучение (МО) и высокопроизводительные вычисления (ВПВ) становятся ключевыми для инноваций в различных отраслях. Однако они также приносят вызовы, которые нельзя игнорировать. Эти рабочие нагрузки требуют мощных вычислительных ресурсов, эффективного управления памятью и хорошо оптимизированного программного обеспечения.

Проблемы миграции и масштабирования

Для разработчиков миграция устаревшего кода на платформы с поддержкой GPU может быть сложной задачей. Масштабирование на многонодовых системах добавляет еще один уровень сложности. Проприетарные платформы могут ограничивать гибкость, что затрудняет внедрение новых технологий. Открытые платформы с продвинутыми оптимизациями становятся важным решением для раскрытия потенциала GPU-ускорителей.

AMD ROCm 6.3: Всеобъемлющая открытая платформа

Чтобы справиться с этими вызовами, AMD представила ROCm 6.3 — открытую платформу, специально разработанную для ИИ, МО и ВПВ на GPU-ускорителях AMD Instinct. Этот релиз сочетает в себе продвинутые инструменты и оптимизации для достижения высокой производительности, оставаясь доступным и адаптируемым для разработчиков.

Ключевые особенности:

  • Поддержка SGLang: Обеспечивает ускоренное выполнение ИИ-инференса с более эффективными языковыми возможностями.
  • Переработанный FlashAttention-2: Улучшает скорость обучения и инференса ИИ, устраняя узкие места в механизмах внимания.
  • Поддержка многонодового FFT: Повышает масштабируемость для рабочих процессов ВПВ.
  • Улучшенные библиотеки компьютерного зрения: Включает алгоритмы, которые повышают производительность задач ИИ, связанных с обработкой изображений.
  • Компилятор AMD Fortran: Помогает интегрировать устаревшие кодовые базы в среду с GPU-ускорением.

Технические особенности и преимущества

ROCm 6.3 разработан с акцентом на удовлетворение потребностей современных рабочих нагрузок. Некоторые ключевые технические особенности включают:

  • Оптимизация производительности: FlashAttention-2 улучшает использование памяти и вычислительную эффективность.
  • Масштабируемость: Поддержка многонодового FFT позволяет эффективно масштабировать рабочие процессы ВПВ.
  • Доступность для разработчиков: Компилятор AMD Fortran позволяет пользователям интегрировать устаревший код в среды с GPU-ускорением.
  • Специализированные инструменты: Улучшенные библиотеки компьютерного зрения упрощают разработку ИИ-приложений.

Результаты и выводы

Обратная связь от первых пользователей ROCm 6.3 показывает заметные улучшения в производительности и удобстве использования. Например, FlashAttention-2 увеличивает эффективность обучения для трансформеров до 30%. Поддержка многонодового FFT демонстрирует отличную масштабируемость, позволяя исследователям более эффективно обрабатывать большие наборы данных.

Заключение

AMD ROCm 6.3 решает критические задачи в ИИ, МО и ВПВ с набором функций и оптимизаций. Сосредоточившись на масштабируемости, интеграции устаревшего кода и производительности, он предлагает разработчикам и организациям надежный и гибкий набор инструментов для удовлетворения требований современного вычисления.

Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, используйте решения ROCm 6.3. Проанализируйте, как ИИ может изменить вашу работу, определите ключевые показатели эффективности (KPI) и внедряйте ИИ постепенно.

Если вам нужны советы по внедрению ИИ, пишите нам в Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.

Попробуйте AI Sales Bot — этот ИИ-ассистент в продажах помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab.

“`

Полезные ссылки: