BingoGuard: Новая система модерации от Salesforce AI для точной оценки контента

Itinai.com it company office background blured chaos 50 v 14a9a2fa 3bf8 4cd1 b2f6 5c758d82bf3e 0

Введение BingoGuard от Salesforce AI

Salesforce AI представляет BingoGuard — систему модерации на основе больших языковых моделей (LLM), которая предсказывает как бинарные метки безопасности, так и уровни серьезности контента.

Проблемы традиционных систем модерации

Современные большие языковые модели открывают новые возможности, но также создают проблемы, такие как генерация вредоносного контента. Традиционные системы модерации часто используют бинарные классификации (безопасный/опасный), что не позволяет точно различать уровни вредности. Это может привести к излишне строгой модерации, уменьшающей взаимодействие пользователей, или к недостаточной фильтрации, что подвергает пользователей риску.

Решение BingoGuard

BingoGuard решает эти проблемы, предсказывая бинарные метки безопасности и детализированные уровни серьезности. Система использует структурированную таксономию, классифицируя потенциально вредный контент на одиннадцать категорий, таких как насилие, сексуальный контент, ненормативная лексика и другие. Каждая категория имеет пять четко определенных уровней серьезности, что позволяет платформам точно настраивать параметры модерации в соответствии с их стандартами безопасности.

Технические аспекты BingoGuard

BingoGuard использует методологию для создания своего обучающего набора данных, BingoGuardTrain, который состоит из 54,897 записей с различными уровнями серьезности и стилями контента. Модель BingoGuard-8B демонстрирует высокую точность обнаружения, превосходя ведущие модели модерации, такие как WildGuard и ShieldGemma, с улучшениями до 4.3%.

Эмпирические результаты

Тестирование на наборе данных BingoGuardTest, содержащем 988 примеров, показало, что BingoGuard-8B лучше определяет контент низкой серьезности (уровни 1 и 2), что традиционно сложно для бинарных систем классификации. Эти результаты подчеркивают необходимость явного учета различий в уровнях серьезности.

Заключение

BingoGuard повышает точность и эффективность модерации контента, интегрируя детальные оценки серьезности наряду с бинарными оценками безопасности. Это позволяет платформам более точно и чутко управлять модерацией, минимизируя риски, связанные с чрезмерной или недостаточной модерацией.

BingoGuard Image

Практические рекомендации по внедрению ИИ в бизнес

Изучите процессы, которые можно автоматизировать, и определите моменты взаимодействия с клиентами, где ИИ может добавить наибольшую ценность.
Определите важные KPI, чтобы убедиться, что ваши инвестиции в ИИ действительно положительно влияют на бизнес.
Выберите инструменты, которые соответствуют вашим потребностям и позволяют настраивать их под ваши цели.
Начните с небольшого проекта, соберите данные о его эффективности и постепенно расширяйте использование ИИ в вашей работе.

Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей ИИ, подписывайтесь на наш Telegram.

Пример решения на основе ИИ

Посмотрите на практический пример решения с использованием ИИ: бот для продаж от itinai.ru/aisales, предназначенный для автоматизации общения с клиентами круглосуточно и управления взаимодействием на всех этапах клиентского пути.

Сотрудничество

Бесплатный ИИ текст генератор

Спросить ИИ чат

Заказать разработку

03.04.2025