Microsoft AI представляет Direct Nash Optimization (DNO): масштабируемый алгоритм машинного обучения, объединяющий простоту и стабильность контрастного обучения с теоретической общностью оптимизации общих предпочтений.

Itinai.com it company office background blured photography by 5fd12c31 5208 4b8e aafe 893f47620ac9 1

Эволюция искусственного интеллекта и внедрение прямой оптимизации Нэша (DNO)

Практические решения и ценность

Развитие больших языковых моделей (LLM) значительно продвинуло искусственный интеллект, но выравнивание этих моделей с человеческой этикой и ценностями оказалось сложной задачей. Традиционные методы, такие как обучение с подкреплением по обратной связи от человека (RLHF), добились определенного прогресса, но испытывают трудности в полном учете человеческих предпочтений и этических соображений.

Исследования Microsoft Research привели к внедрению прямой оптимизации Нэша (DNO) для улучшения LLM путем сосредоточения на общих предпочтениях, а не только на максимизации вознаграждения. Этот подход упрощает и масштабирует выравнивание LLM с человеческими ценностями, как это показывают эмпирические оценки.

Внедрение DNO с моделью Orca-2.5 показало значительное увеличение победного процента на 33%, что позволяет считать его ведущим методом для посттренировочных LLM. Этот успех подчеркивает его потенциал для революционизации отрасли и превосходства над традиционными моделями и методиками.

Снимок исследования

В заключение, DNO представляет собой ключевой прогресс в улучшении LLM, решая проблему выравнивания этих моделей с человеческими этическими стандартами и сложными предпочтениями. Он преодолевает ограничения предыдущих техник и устанавливает новый стандарт для посттренировочных LLM.

Если вы хотите развивать свою компанию с помощью искусственного интеллекта, рассмотрите возможность использования прямой оптимизации Нэша от Microsoft AI, чтобы оставаться конкурентоспособным и переосмыслить свой способ работы.

Пример практического решения в области искусственного интеллекта

Рассмотрите AI Sales Bot от itinai.com/aisalesbot, разработанный для автоматизации взаимодействия с клиентами круглосуточно и управления взаимодействием на всех этапах путешествия клиента.

Список полезных ссылок:

AI Lab в Telegram @aiscrumbot – бесплатная консультация

Twitter – @itinaicom