Достижение баланса в обучении на протяжении всей жизни: подход WISE к запоминанию

 Achieving Balance in Lifelong Learning: The WISE Memory Approach

“`html

Достижение баланса в пожизненном обучении: подход памяти WISE

LLM-модели демонстрируют важные интеллектуальные возможности, увеличивая параметры, вычисления и объем данных, намекая на искусственный общий интеллект. Однако даже при продвинутых возможностях развернутые LLM-модели все еще подвержены ошибкам, таким как галлюцинации, предвзятость и фактические неточности. Постоянное развитие знаний представляет собой вызов для их предварительного обучения. Быстрое устранение ошибок во время развертывания критично, поскольку повторное обучение или точная настройка часто являются чрезвычайно дорогостоящими и представляют устойчивость проблем для адаптации к росту знаний на протяжении всей жизни.

Практические решения:

Для обновления долговременной памяти можно использовать (пере)обучение, точную настройку и редактирование модели, а для вывода – методы, улучшающие вывод, такие как GRACE. Однако по-прежнему идут споры о эффективности точной настройки по сравнению с извлечением. Существующие методы внедрения знаний сталкиваются с проблемами, такими как вычислительная нагрузка и переобучение. Техники редактирования моделей, включая ограниченную точную настройку и мета-обучение, направлены на эффективное редактирование LLM-моделей. Недавние достижения сосредоточены на пожизненном редактировании, но требуют обширного обучения в конкретной области, что представляет вызов в предсказании предстоящих изменений и доступе к соответствующим данным.

После тщательного изучения вышеуказанных проблем и подходов исследователи из Университета Чжэцзян и Группы Alibaba предлагают свой метод WISE – двойную параметрическую схему памяти, состоящую из основной памяти для предварительных знаний и побочной памяти для отредактированных знаний. Только побочная память подвергается редактированию, и маршрутизатор определяет, какую память использовать для запросов. Для непрерывного редактирования WISE использует механизм обмена знаниями, разделяя редактирование на различные параметрические подпространства, чтобы предотвратить конфликты перед их объединением в общую память.

Значение:

WISE состоит из двух основных компонентов: проектирование побочной памяти и разделение и объединение знаний. Первое включает в себя побочную память, инициализированную как копию определенного слоя FFN LLM, хранящую изменения, и механизм маршрутизации для выбора памяти во время вывода. Второе использует разделение знаний для разделения изменений на случайные подпространства для редактирования и техники объединения знаний для объединения этих подпространств в единую побочную память. Кроме того, WISE представляет WISE-Retrieve, позволяющий извлечение из нескольких побочных памятей на основе баллов активации, улучшая сценарии пожизненного редактирования.

WISE демонстрирует превосходную производительность по сравнению с существующими методами как в ситуациях вопросно-ответной системы, так и в ситуациях галлюцинаций. Он превосходит конкурентов, особенно в случае длинных последовательностей редактирования, добиваясь значительных улучшений стабильности и эффективного управления последовательными изменениями. В то время как методы, такие как MEND и ROME, конкурентоспособны в начале, они терпят неудачу при увеличении длины последовательности изменений. Прямое редактирование долговременной памяти приводит к значительному снижению локальности, ухудшая обобщение. GRACE превосходит в локальности, но жертвует обобщением при непрерывном редактировании. WISE достигает баланса между надежностью, обобщением и локальностью, превосходя базовые значения в различных задачах. При оценке вне диапазона WISE демонстрирует отличную обобщающую производительность, превосходя другие методы.

Это исследование выявляет проблему одновременного достижения надежности, обобщения и локальности в существующих подходах к пожизненному редактированию моделирования, относя это к разрыву между рабочей и долговременной памятью. Для преодоления этой проблемы был предложен WISE, включающий побочную память и техники объединения моделей. Результаты показывают, что WISE обещает одновременно достигать высоких показателей по различным наборам данных и LLM-моделям.

Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter. Присоединяйтесь к нашему каналу в Telegram, Discord и группе LinkedIn.

Если вам нравится наша работа, вам понравится наш новостной бюллетень.

Не забудьте присоединиться к нашему SubReddit 42k+ ML.

Источник: MarkTechPost.

Как использовать искусственный интеллект для развития вашего бизнеса

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте Achieving Balance in Lifelong Learning: The WISE Memory Approach.

Практические решения:

Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI. Определитесь какие ключевые показатели эффективности (KPI): вы хотите улучшить с помощью ИИ.

Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI. На полученных данных и опыте расширяйте автоматизацию.

Если вам нужны советы по внедрению ИИ, пишите нам на https://t.me/itinai. Следите за новостями о ИИ в нашем Телеграм-канале t.me/itinainews или в Twitter @itinairu45358.

Попробуйте AI Sales Bot https://itinai.ru/aisales. Этот AI ассистент в продажах, помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж, снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru. Будущее уже здесь!

“`

Полезные ссылки: