Новый метод KernelSHAP-IQ для оптимизации весовых коэффициентов для взаимодействий Шепли.

 This AI Paper Introduces KernelSHAP-IQ: Weighted Least Square Optimization for Shapley Interactions

“`html

Интерпретируемость моделей машинного обучения: значимость и практические решения

Значимость интерпретируемости

Интерпретируемость моделей машинного обучения – критически важная область исследований для понимания процессов принятия решений сложных моделей. Эти модели часто рассматриваются как “черные ящики”, что затрудняет выявление влияния конкретных характеристик на их прогнозы. Техники, такие как атрибуция признаков и индексы взаимодействия, были разработаны для прояснения этих вкладов, тем самым повышая прозрачность и надежность систем искусственного интеллекта. Возможность точно интерпретировать эти модели является необходимой для отладки и улучшения моделей, а также обеспечения их справедливого функционирования без непреднамеренных предвзятостей.

Вызовы в области интерпретируемости

Значительным вызовом в этой области является эффективное распределение кредитов на различные характеристики в модели. Традиционные методы, такие как значение Шепли, предоставляют надежную основу для атрибуции признаков, но они должны быть модернизированы для учета взаимодействий более высокого порядка среди признаков. Взаимодействия более высокого порядка относятся к совместному воздействию нескольких признаков на выход модели, что является важным для полного понимания сложных систем. Без учета этих взаимодействий методы интерпретируемости могут упустить важные синергии или избыточности между признаками, приводя к неполным или вводящим в заблуждение объяснениям.

Решения и практические результаты

Недавно исследователи из университетов Билефельд, ЛМУ Мюнхен и Падерборн представили новый метод под названием KernelSHAP-IQ для решения этих вызовов. Этот метод расширяет возможности KernelSHAP за счет включения взаимодействий Шепли более высокого порядка. KernelSHAP-IQ использует оптимизацию взвешенных наименьших квадратов для точного захвата и количественной оценки взаимодействий выше первого порядка. Это значительное усовершенствование позволяет учитывать сложные взаимодействия признаков, которые часто присутствуют в сложных моделях, но упускаются традиционными методами.

KernelSHAP-IQ строит оптимальное приближение индекса взаимодействия Шепли с использованием итеративных k-аддитивных приближений. Он начинает с взаимодействий первого порядка и постепенно включает взаимодействия более высокого порядка. Метод использует оптимизацию взвешенных наименьших квадратов для точного захвата взаимодействий признаков. Подход был протестирован на различных наборах данных, включая набор данных регрессии жилья в Калифорнии, модель анализа настроений с использованием отзывов IMDB и классификаторы изображений, такие как ResNet18 и Vision Transformer. Путем выборочного отбора подмножеств и решения задач WLS, KernelSHAP-IQ обеспечивает подробное представление взаимодействий признаков, обеспечивая вычислительную эффективность и точную интерпретируемость.

Производительность KernelSHAP-IQ была оценена на различных наборах данных и классах моделей, демонстрируя передовые результаты. Например, в экспериментах с набором данных регрессии жилья в Калифорнии KernelSHAP-IQ значительно улучшил среднеквадратичную ошибку (MSE) в оценке значений взаимодействия, превзойдя базовые методы. Этот процесс достиг среднеквадратичной ошибки 0,20 по сравнению с 0,39 и 0,59 для существующих техник. Кроме того, способность KernelSHAP-IQ идентифицировать десять наибольших оценок взаимодействий с высокой точностью была очевидна при выполнении задач, связанных с моделями анализа настроений и классификаторами изображений. Эмпирические оценки подчеркнули способность метода захватывать и точно представлять взаимодействия более высокого порядка, которые являются важными для понимания поведения сложных моделей. Исследование показало, что KernelSHAP-IQ последовательно обеспечивает более точные и интерпретируемые результаты, улучшая общее понимание динамики модели.

В заключение, исследование представило KernelSHAP-IQ, метод захвата взаимодействий признаков более высокого порядка в моделях машинного обучения с использованием итеративных k-аддитивных приближений и оптимизации взвешенных наименьших квадратов. Протестированный на различных наборах данных, KernelSHAP-IQ продемонстрировал улучшенную интерпретируемость и точность. Эта работа решает критическую проблему интерпретируемости моделей путем эффективного количественного оценивания сложных взаимодействий признаков, обеспечивая более полное понимание поведения модели. Достижения KernelSHAP-IQ вносят значительный вклад в область объяснимого искусственного интеллекта, обеспечивая лучшую прозрачность и доверие к системам машинного обучения.

Проверьте статью. Вся заслуга за это исследование принадлежит ученым этого проекта. Также не забудьте подписаться на нас в Twitter. Присоединяйтесь к нашему каналу в Telegram, Discord и группе в LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему подпишитесь на наш подпишитесь на наш 42k+ ML SubReddit

Пост опубликован на MarkTechPost.

“`

Полезные ссылки: