Модель обобщаемой награды (GRM): эффективный подход ИИ для улучшения обобщаемости и устойчивости обучения на основе наград для LLM.

Itinai.com overwhelmed ui interface google style million butt 4839bc38 e4ae 425e bf30 fe84f7941f4c 3

«`html

Применение Generalizable Reward Model (GRM) в искусственном интеллекте

Предварительно обученные большие модели показали впечатляющие возможности в различных областях. Недавние исследования сосредотачиваются на обеспечении соответствия этих моделей человеческим ценностям и предотвращении вредных поведенческих шаблонов. Для достижения этой цели ключевыми являются методы выравнивания, важными из которых являются надзорное дообучение (SFT) и обучение с подкреплением на основе обратной связи от людей (RLHF). RLHF полезно для обобщения модели вознаграждения на новые пары запрос-ответ. Однако он сталкивается с проблемой обучения модели вознаграждения, которая хорошо работает с невидимыми данными. Одной из распространенных проблем является «переоптимизация» или «взлом вознаграждения». Увеличение размера модели вознаграждения и объема тренировочных данных может помочь решить эту проблему, но это непрактично в реальных ситуациях.

Два подхода в связанной работе

Первый подход — Моделирование вознаграждения, где модели вознаграждения обучаются на данных предпочтений людей для направления процесса RLHF или оптимизации запросов. Недавние исследования сосредотачиваются на разработке более эффективных моделей вознаграждения для улучшения производительности больших языковых моделей (LLM) в RLHF. Это включает улучшение моделирования вознаграждения путем улучшения качества или количества данных предпочтений. Второй подход — Смягчение переоптимизации в RLHF, где модели вознаграждения часто переобучаются и плохо обобщаются за пределы тренировочных данных, что приводит к проблеме переоптимизации. Можно наказывать слишком уверенные выводы модели, используя сглаживание меток или регуляризацию SFT для устранения этой проблемы.

Результаты исследования

Исследователи из HKUST, Грузинского института технологий и Университета Иллинойса в Урбана-Шампейне представили Generalizable Reward Model (GRM), который использует регуляризацию генерации текста на скрытых состояниях для улучшения производительности моделей вознаграждения. Их исследование показывает, что все три типа регуляризации генерации текста хорошо работают с GRM, причем регуляризация SFT является наиболее эффективным и надежным решением. Результаты демонстрируют, что GRM значительно улучшает точность моделей вознаграждения в различных задачах вне распределения. Кроме того, он последовательно повышает производительность RLHF и помогает уменьшить проблему переоптимизации.

Заключение

В заключение, исследователи предложили Generalizable Reward Model (GRM) — эффективный метод, который направлен на улучшение обобщаемости и устойчивости обучения вознаграждения для LLM. GRM использует техники регуляризации на скрытых состояниях моделей вознаграждения, что значительно улучшает их обобщаемую производительность для невидимых данных. Кроме того, предложенный подход эффективно уменьшает проблему переоптимизации в RLHF. Эти результаты поддержат будущие исследования по созданию более сильных моделей вознаграждения, помогая эффективнее выстраивать большие модели и обеспечивать экономическую эффективность.

Проверьте статью. Вся кредит за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter.

Присоединяйтесь к нашему Telegram-каналу и группе LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему 46 тыс. подписчиков ML SubReddit.

Источник: MarkTechPost

«`

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Сотрудничество

Бесплатный ИИ текст генератор

Спросить ИИ чат

Заказать разработку

12.07.2024

Владимир Дьячков PhD

Лучшие ИИ

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ

28.12.2024

Лучшие ИИ

Коллективный поиск по дереву Монте-Карло: новый метод обучения для многомодальных языковых моделей

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
14.05.2024

Лучшие ИИ

Прогресс и проблемы в методах обнаружения и классификации дронов

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
30.07.2024

Лучшие ИИ

Neural Magic выпускает полностью квантованную версию модели Llama 3.1 405B с FP8

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
05.09.2024

Лучшие ИИ

Новая технология распознавания речи с улучшенной точностью временных меток, устойчивостью к шумам и точным определением дисфлюенции для клинических приложений

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
16.06.2024

Лучшие ИИ

Открытая система управления роботом VLA с 7 параметрами, устанавливающая новые стандарты для политики манипуляции.

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
30.07.2024

Лучшие ИИ

Инструмент Lean Copilot: Искусственный интеллект для автоматизации доказательств в Lean

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
02.05.2024

Лучшие ИИ

Ученые из Стэнфорда и Amazon разработали STARK: крупномасштабный бенчмарк для поиска полуструктурированных данных в текстовых и реляционных базах знаний

AI Product, AI Исследования, AI Новости, AI Продажи, AI сотрудники, NLP, ИИ
04.03.2025

Лучшие ИИ

Проект Александрийская Библиотека: Доступ к Научным Знаниям через Структурированное Извлечение Фактов с Помощью LLM

Введение Научная публикация значительно расширилась за последние десятилетия, однако доступ к важным исследованиям остается ограниченным для многих, особенно в развивающихся странах, независимых исследователей и небольших академических институций. Повышение…

AI Новости

Модель обобщаемой награды (GRM): эффективный подход ИИ для улучшения обобщаемости и устойчивости обучения на основе наград для LLM.

Применение Generalizable Reward Model (GRM) в искусственном интеллекте

Два подхода в связанной работе

Результаты исследования

Заключение

Полезные ссылки:

AI Lab in Telegram @itinai — бесплатная консультация

Телеграм сообщество — @itinairu

Запустите свой ИИ проект бесплатно

Как коучу продавать через AI 24/7

AI в нише животных — бизнес для зоомагазина и блогера

Инфлюенсер и AI — монетизация личного бренда

Монетизация канала о фрилансе и удалённой работе

ИИ-агенты искусственный интеллект онлайн для бизнеса

ИИ-Специалист по соблюдению норм : автоматизация проверки документов

ИИ-Аналитик социальных сетей : генерация стратегий контента

ИИ-Агент для автоматизации медицинских записей : структурирование данных пациентов

ИИ-Агент по автоматизации отчетности : генерация финансовых и операционных отчетов

Как UX-копирайтеру оптимизировать тексты кнопок в интерфейсе: ИИ предложит формулировки A/B-вариантов

Как не теряться в диалоге: искусственный интеллект сгенерирует 5 реакций на нестандартные ответы клиента

Как описать пользовательские истории по Agile: ИИ предложит шаблоны user stories и acceptance criteria

Как составить юридическое заключение по проекту: ИИ структурирует документ и предложит формулировки

Как системному аналитику описать API-запрос к внешней системе: ИИ предложит структуру спецификации с примерами

Как отработать “мне не интересно”: искусственный интеллект предложит 5 фраз под конкретный продукт

Лучший ИИ онлайн

Коллективный поиск по дереву Монте-Карло: новый метод обучения для многомодальных языковых моделей

Прогресс и проблемы в методах обнаружения и классификации дронов

Neural Magic выпускает полностью квантованную версию модели Llama 3.1 405B с FP8

Новая технология распознавания речи с улучшенной точностью временных меток, устойчивостью к шумам и точным определением дисфлюенции для клинических приложений

Открытая система управления роботом VLA с 7 параметрами, устанавливающая новые стандарты для политики манипуляции.

Инструмент Lean Copilot: Искусственный интеллект для автоматизации доказательств в Lean

Ученые из Стэнфорда и Amazon разработали STARK: крупномасштабный бенчмарк для поиска полуструктурированных данных в текстовых и реляционных базах знаний

Проект Александрийская Библиотека: Доступ к Научным Знаниям через Структурированное Извлечение Фактов с Помощью LLM

Условия использования

Вакансии

Подписка

Пресс-релизы

Возврат и гарантии

Политика конфиденциальности