Patronus AI выпустил Lynx v1.1: модель обнаружения галлюцинаций RAG нового поколения

 Patronus AI Releases Lynx v1.1: An 8B State-of-the-Art RAG Hallucination Detection Model

“`html

Patronus AI выпустила серию LYNX v1.1: значительный шаг в области искусственного интеллекта

LYNX v1.1: Решение проблемы галлюцинаций в контенте, созданном искусственным интеллектом

LYNX v1.1 представляет собой значительный шаг в области искусственного интеллекта, особенно в обнаружении галлюцинаций в созданном ИИ-контенте. Галлюцинации в контексте ИИ относятся к генерации информации, которая не подтверждена или противоречит предоставленным данным, что представляет значительную проблему для приложений, полагающихся на точные и надежные ответы. Модели LYNX решают эту проблему с использованием метода retrieval-augmented generation (RAG), который помогает обеспечить, что ответы, сгенерированные ИИ, соответствуют предоставленным документам.

Применение в реальных сценариях и точность

Версия 70В LYNX v1.1 проявила исключительную производительность в этой области. На оценке HaluBench, тестирующем обнаружение галлюцинаций в реальных сценариях, модель 70B достигла впечатляющей точности 87,4%. Это превосходит другие ведущие модели, включая GPT-4o и GPT-3.5-Turbo, и показывает превосходную точность в конкретных задачах, таких как ответы на медицинские вопросы в PubMedQA.

Модель 8B: баланс эффективности и возможностей

Версия 8B LYNX v1.1, известная как Patronus-Lynx-8B-Instruct-v1.1, представляет собой тщательно настроенную модель, которая сбалансирована по эффективности и возможностям. Обученная на различных наборах данных, включая CovidQA, PubmedQA, DROP и RAGTruth, эта версия поддерживает максимальную длину последовательности из 128 000 токенов и в первую очередь ориентирована на английский язык. Продвинутые методики обучения, такие как тренировка смешанной точности и вспышечное внимание, используются для повышения эффективности без ущерба точности. Оценки проводились на 8 графических процессорах Nvidia H100 для обеспечения точных показателей производительности.

Заключение

Модель LYNX 8B серии LYNX v1.1 – это надежный и эффективный инструмент для обнаружения галлюцинаций в созданном ИИ-контенте. В то время как модель 70B лидирует по общей точности, версия 8B предлагает убедительный баланс эффективности и производительности. Ее продвинутые методики обучения, в сочетании с существенными улучшениями производительности, делают ее отличным выбором для различных приложений машинного обучения, особенно там, где критично обнаружение галлюцинаций в реальном времени. LYNX v1.1 является открытым исходным кодом, с открытыми весами и данными, обеспечивая доступность и прозрачность для всех пользователей.

Проверьте статью, попробуйте ее в HuggingFace Spaces и скачайте LYNX v1.1 на HuggingFace. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте последить за нами в Twitter и присоединиться к нашей группе в LinkedIn. Если вам нравится наша работа, вам понравится наш информационный бюллетень.

Не забудьте присоединиться к нашему сообществу на Reddit.

Найдите предстоящие вебинары по искусственному интеллекту здесь.


“`

Полезные ссылки: