OLMoTrace: Обеспечение прозрачности в выводах языковых моделей в реальном времени

Allen Institute for AI (Ai2) запускает OLMoTrace: отслеживание выходных данных LLM в реальном времени

Понимание ограничений прозрачности языковых моделей

С ростом применения больших языковых моделей (LLM) в различных сферах, таких как поддержка принятия решений, образование и научные исследования, становится все более важным понимать их внутренние механизмы. Основная проблема заключается в том, как определить, откуда берется ответ модели. Большинство LLM обучаются на огромных наборах данных, состоящих из триллионов токенов, но до сих пор не существовало практического инструмента для сопоставления выходных данных модели с данными, которые на нее повлияли. Эта непрозрачность затрудняет оценку надежности, отслеживание фактических источников информации и исследование потенциальной запоминания или предвзятости.

OLMoTrace – инструмент для отслеживания выходных данных в реальном времени

Allen Institute for AI (Ai2) недавно представил OLMoTrace, систему, предназначенную для отслеживания сегментов ответов, сгенерированных LLM, обратно к их обучающим данным в реальном времени. Система построена на основе открытых моделей OLMo от Ai2 и предоставляет интерфейс для выявления точных совпадений между сгенерированным текстом и документами, использованными во время обучения модели. В отличие от подходов, основанных на извлечении внешнего контекста во время вывода, OLMoTrace предназначен для постфактумной интерпретации — он выявляет связи между поведением модели и предыдущим опытом во время обучения.

Техническая архитектура и проектные соображения

В основе OLMoTrace лежит infini-gram, индексирующий и поисковый движок, созданный для работы с текстовыми корпусами экстремального масштаба. Система использует структуру на основе суффиксного массива для эффективного поиска точных сегментов из выходных данных модели в обучающих данных. Основной конвейер вывода состоит из пяти этапов:

  • Идентификация сегментов: Извлекает все максимальные сегменты из выходных данных модели, которые совпадают с последовательностями в обучающих данных.
  • Фильтрация сегментов: Ранжирует сегменты на основе вероятности, что помогает выделить более длинные и менее частые фразы.
  • Извлечение документов: Для каждого сегмента система извлекает до 10 соответствующих документов.
  • Объединение: Консолидирует перекрывающиеся сегменты и дубликаты для уменьшения избыточности.
  • Ранжирование релевантности: Применяет оценку BM25 для ранжирования извлеченных документов.

Эта конструкция обеспечивает точность результатов отслеживания с средней задержкой 4.5 секунды для выходных данных модели объемом 450 токенов.

Оценка, выводы и варианты использования

Ai2 оценил OLMoTrace, используя 98 сгенерированных LLM разговоров. Релевантность документов оценивалась как людьми, так и моделью (gpt-4o). Топ-документ получил среднюю оценку релевантности 1.82 (по шкале от 0 до 3).

Примеры применения

Три примера использования демонстрируют полезность системы:

  • Проверка фактов: Пользователи могут определить, был ли фактический факт запомнен из обучающих данных.
  • Анализ творческого выражения: Даже казалось бы новые или стилизованные языковые конструкции могут быть прослежены до фанфиков или литературных образцов.
  • Математическое рассуждение: OLMoTrace может выявлять точные совпадения для символических вычислений.

Последствия для открытых моделей и аудита моделей

OLMoTrace подчеркивает важность прозрачности в разработке LLM, особенно для открытых моделей. Хотя инструмент только выявляет лексические совпадения, он предоставляет конкретный механизм для исследования того, как и когда языковые модели повторно используют обучающий материал.

Практические рекомендации для бизнеса

Рассмотрите возможность автоматизации процессов в вашей компании. Найдите моменты в взаимодействии с клиентами, где искусственный интеллект может добавить наибольшую ценность. Определите ключевые показатели эффективности (KPI), чтобы убедиться, что ваши инвестиции в ИИ приносят положительный результат.

Выберите инструменты, которые соответствуют вашим потребностям и позволяют настраивать их под ваши цели. Начните с небольшого проекта, соберите данные о его эффективности, а затем постепенно расширяйте использование ИИ в вашей работе.

Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей ИИ, подписывайтесь на наш Telegram.

Пример решения на основе ИИ

Посмотрите на практический пример решения на основе ИИ: бот по продажам от itinai.ru, предназначенный для автоматизации взаимодействия с клиентами круглосуточно и управления взаимодействиями на всех этапах клиентского пути.

AI Technology

Новости в сфере искусственного интеллекта