Система обучения Poplar: расширение оптимизатора Zero Redundancy Optimizer (ZeRO) с поддержкой гетерогенных возможностей

 Poplar: A Distributed Training System that Extends Zero Redundancy Optimizer (ZeRO) with Heterogeneous-Aware Capabilities

“`html

Расширение возможностей нулевого оптимизатора избыточности (ZeRO) с учетом гетерогенности в системе распределенного обучения Poplar

Проблема

Сегодня для обучения модели требуется больше памяти и вычислительной мощности, чем может предоставить один акселератор из-за экспоненциального роста параметров модели. Эффективное использование объединенной вычислительной мощности и памяти через большое количество GPU является ключевым для обучения моделей в большом масштабе.

Ограниченное количество доступных GPU для некоторых академиков делает невозможным для них обучение массовых моделей независимо. Покупка нового оборудования также дорога из-за частой выпуска продукции GPU.

Решение

Poplar – инновационная система распределенного обучения, которая учитывает гетерогенность GPU, вычислительные возможности, объем памяти и их комбинации. Путем расширения ZeRO до включения гетерогенных GPU и независимого назначения заданий каждому GPU, Poplar обеспечивает максимальную глобальную производительность.

Команда также представляет новый метод оценки гетерогенности GPU, проводя гранулярные анализы для каждого этапа ZeRO для сокрытия разрыва в производительности между моделью стоимости и реальными результатами.

Исследователи разработали алгоритм поиска, который работает независимо от подхода к пакетному распределению, чтобы гарантировать равномерную нагрузку.

Практическое применение

Poplar продемонстрировал превосходство над другими подходами в отношении скорости обучения на реальных гетерогенных GPU-кластерах.

Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter @itinairu45358.

Попробуйте AI Sales Bot, который помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru.

“`

Полезные ссылки: