Новый тест для оценки кибербезопасности с применением машинного обучения

 Meta AI Introduces CyberSecEval 2: A Novel Machine Learning Benchmark to Quantify LLM Security Risks and Capabilities

“`html

Большие языковые модели (LLM) и кибербезопасность: новые вызовы и практические решения

Большие языковые модели (LLM) все шире используются, что создает новые кибербезопасные риски. Эти риски возникают из их основных характеристик: увеличенная способность генерации кода, развертывание в реальном времени для генерации кода, автоматизированное выполнение в интерпретаторах кода и интеграция в приложения, обрабатывающие ненадежные данные. Это создает необходимость в надежной системе оценки кибербезопасности.

Практические решения:

  • Оценка безопасности LLM включает использование открытых бенчмарков и критериев оценки, таких как CyberMetric, SecQA, WMDP-Cyber, CyberBench и LLM4Vuln.
  • Meta AI представляет CYBERSECEVAL 2, бенчмарк для оценки рисков и возможностей LLM, включая тестирование внедрения и эксплуатации уязвимостей, а также злоупотребление интерпретатором кода.
  • Исследование также выявляет компромисс между безопасностью и полезностью (FRR) и способность LLM обрабатывать запросы в кибератаках, обеспечивая их безопасность и полезность.

Основные результаты и вклад:

  • Добавлены тесты внедрения, оценивающие 15 категорий атак на LLM.
  • Введены оценки соответствия LLM инструкциям, направленным на компрометацию интерпретаторов кода.
  • Включен набор оценок, измеряющий способности LLM создавать эксплойты на C, Python и Javascript, включая уязвимости в логике, эксплойты памяти и SQL-инъекции.
  • Представлен новый набор данных для оценки FRR LLM в задачах кибербезопасности, показывающий баланс полезности и вреда.

Заключение:

Исследование представляет CYBERSECEVAL 2, обширный набор бенчмарков для оценки кибербезопасных рисков LLM. Несмотря на улучшение производительности, проблемы в области безопасности продолжают существовать. Использование FRR позволяет эффективно оценить компромисс между безопасностью и полезностью, а результаты задач эксплуатации показывают необходимость дальнейших исследований перед автономной способностью LLM эксплуатировать системы.

Подробнее ознакомиться с исследованием и GitHub.

Вся благодарность за это исследование принадлежит его авторам. Также не забывайте следить за нами в Twitter, присоединиться к нашему Telegram-каналу, Discord-каналу и группе в LinkedIn.

Если вам нравится наша работа, вам понравится и наша рассылка.

Не забудьте присоединиться к нашему ML SubReddit.

Если вы заинтересованы в развитии вашего бизнеса с использованием искусственного интеллекта, обращайтесь к нам для консультаций по внедрению ИИ. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter. Попробуйте наш AI Sales Bot для улучшения работы с клиентами здесь. Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab здесь.

“`

Полезные ссылки: