Сжатие набора данных на основе динамической дифференциальной конфиденциальности

 Dynamic Differential Privacy-based Dataset Condensation

“`html

Dynamic Differential Privacy-based Dataset Condensation

По мере увеличения объема данных становится все важнее эффективное сжатие данных. Сжатие данных включает в себя синтез более маленького набора данных, который сохраняет основную информацию из исходного набора, тем самым уменьшая затраты на хранение и вычисления без ущерба для производительности модели. Однако возникли проблемы с конфиденциальностью, которые также являются значительным вызовом при сжатии данных. В настоящее время существующие методы сжатия данных с защитой конфиденциальности часто добавляют постоянный шум к градиентам с использованием фиксированных параметров конфиденциальности. Этот подход может вводить избыточный шум, что снижает точность модели, особенно в цветных наборах данных с небольшими нормами обрезки.

Практические решения и ценность

Новый подход Dyn-PSG (Dynamic Differential Privacy-based Dataset Condensation) предлагает динамическое снижение порога обрезки в процессе обучения, что позволяет уменьшить добавляемый шум на поздних этапах обучения. Кроме того, он адаптирует меры чувствительности на основе максимальной 𝑙2-нормы, обнаруженной в градиентах для каждого примера, обеспечивая, что избыточный шум не вводится в градиенты, когда это необходимо. Этот подход на основе динамических параметров улучшает полезность и визуальное качество по сравнению с существующими методами, соблюдая строгие гарантии конфиденциальности.

Для оценки предложенного метода исследовательская группа провела обширные эксперименты с использованием нескольких эталонных наборов данных, включая MNIST, FashionMNIST, SVHN и CIFAR10, охватывающих ряд задач классификации изображений с различной сложностью и разрешением. Результаты показали, что Dyn-PSG превзошел существующие подходы в точности, сохраняя при этом гарантии конфиденциальности.

В целом, эти комплексные оценки продемонстрировали, что Dyn-PSG является эффективным методом для сжатия данных с учетом динамической дифференциальной конфиденциальности.

В заключение, Dyn-PSG предлагает динамическое решение для сжатия данных с учетом конфиденциальности, обеспечивая лучшую точность по сравнению с существующими методами. Эксперименты с несколькими наборами данных и архитектурами демонстрируют, что Dyn-PSG эффективно балансирует полезность данных и конфиденциальность, делая его превосходным подходом для эффективного сжатия данных.

Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter и присоединиться к нашему Telegram-каналу и группе в LinkedIn. Если вам нравится наша работа, вам понравится наш новостной бюллетень.

Не забудьте присоединиться к нашему 50k+ ML SubReddit

БЕСПЛАТНЫЙ ВЕБИНАР ПО ИИ: “SAM 2 для видео: как настроить на ваши данные” (Ср, 25 сентября, 4:00 – 4:45 EST)

Пост Dynamic Differential Privacy-based Dataset Condensation впервые появился на MarkTechPost.


“`

Полезные ссылки: