Механистическое разучивание: новый метод ИИ для редактирования компонентов модели, связанных с запоминанием фактов.

 Mechanistic Unlearning: A New AI Method that Uses Mechanistic Interpretability to Localize and Edit Specific Model Components Associated with Factual Recall Mechanisms

“`html

Механистическое “разучивание”: новый метод ИИ

Большие языковые модели (LLMs) иногда усваивают нежелательные знания. Важно находить способы удаления или корректировки этой информации, чтобы ИИ оставался точным и надежным. Однако редактирование или “разучивание” конкретных знаний в этих моделях — сложная задача. Обычные методы часто влияют на другие данные, что может снизить общие способности модели.

Проблемы текущих методов

Существующие методы редактирования и “разучивания” знаний часто затрагивают другие возможности модели и не всегда являются надежными. Небольшие изменения в запросах могут вернуть исходные знания, а безопасность не всегда гарантирует отсутствие вредных ответов.

Что такое механистическое “разучивание”?

Исследователи из Университета Мэриленда и других организаций предложили новый метод — механистическое “разучивание”. Этот метод использует механистическую интерпретируемость для локализации и редактирования конкретных компонентов модели, связанных с фактическими механизмами. Это позволяет делать изменения более надежными и снижать неожиданные побочные эффекты.

Эффективные результаты

В исследовании были протестированы методы удаления информации в двух наборах данных: Sports Facts и CounterFact. В первом наборе удаляли связи с баскетболистами, а во втором меняли правильные ответы на неверные. Основные техники включали Output Tracing и локализацию фактов.

Результаты показали, что ручная локализация улучшает точность и надежность, особенно в тестах с выбором ответа. Это также затрудняет повторное усвоение информации. Тесты показали, что оптимизация в основном изменяет параметры, связанные с извлечением фактов, что подчеркивает необходимость улучшения процесса поиска фактов для повышения надежности.

Заключение

Этот метод предлагает многообещающее решение проблемы надежного “разучивания” знаний в LLMs, повышая эффективность и устойчивость процесса. Мы рекомендуем рассмотреть механистическое “разучивание” как потенциальную платформу для тестирования различных методов интерпретируемости.

Как использовать ИИ в вашем бизнесе?

Если вы хотите, чтобы ваша компания развивалась с помощью ИИ, используйте механистическое “разучивание”.

  • Проанализируйте, как ИИ может изменить вашу работу и где возможно применение автоматизации.
  • Определите ключевые показатели эффективности (KPI), которые хотите улучшить с помощью ИИ.
  • Подберите подходящее решение из множества доступных вариантов ИИ.
  • Внедряйте ИИ постепенно, начиная с небольших проектов и анализируя результаты.

Если вам нужны советы по внедрению ИИ, пишите нам в Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.

Попробуйте AI Sales Bot

Этот ИИ-ассистент помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж. Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab.

“`

Полезные ссылки: