Проверка источников в медицинских ответах ИИ: новая система SourceCheckup от Стэнфорда

Проблемы с надежностью источников в медицинских LLM

С увеличением использования больших языковых моделей (LLM) в сфере здравоохранения становится важным обеспечивать поддержку их выводов надежными источниками. Хотя ни одна LLM еще не получила одобрение FDA для клинического принятия решений, такие модели, как GPT-4o, Claude и MedPaLM, уже показывают лучшие результаты по сравнению с клиницистами на стандартизированных экзаменах, таких как USMLE. Эти модели активно применяются в реальных сценариях, включая поддержку психического здоровья и диагностику редких заболеваний. Однако их склонность к «галлюцинациям» — генерации неподтвержденных или неточных утверждений — представляет серьезный риск, особенно в медицинском контексте, где дезинформация может нанести вред.

Разработка SourceCheckup для оценки достоверности источников

Исследователи Стэнфордского университета разработали инструмент SourceCheckup, который предназначен для автоматической оценки точности, с которой LLM поддерживают свои медицинские ответы соответствующими источниками. Анализируя 800 вопросов и более 58,000 пар «источник-утверждение», они обнаружили, что 50%-90% ответов, сгенерированных LLM, не были полностью поддержаны указанными источниками.

AI в медицине

Проблемы с атрибуцией источников

Исследование показало значительные недостатки в надежности ссылок, сгенерированных LLM, что вызывает серьезные опасения относительно их готовности к использованию в клиническом принятии решений. Модели, даже с доступом к интернету, испытывали трудности с предоставлением ответов, основанных на источниках.

Рекомендации по улучшению доверия к LLM

Для повышения надежности предлагается обучать модели или донастраивать их с акцентом на точную атрибуцию и верификацию. Автоматизированные инструменты, такие как SourceCleanup, также показывают потенциал в редактировании неподдерживаемых утверждений для улучшения фактической обоснованности.

Практические шаги для бизнеса

  1. Изучите процессы, которые можно автоматизировать, и найдите моменты взаимодействия с клиентами, где искусственный интеллект может добавить максимальную ценность.
  2. Определите ключевые показатели эффективности (KPI), чтобы убедиться, что ваши инвестиции в ИИ действительно положительно влияют на бизнес.
  3. Выбирайте инструменты, которые соответствуют вашим потребностям и позволяют настраивать их под ваши цели.
  4. Начните с небольшого проекта, соберите данные о его эффективности и постепенно расширяйте использование ИИ в вашей работе.

Контакты и полезные ресурсы

Если вам нужна помощь в управлении ИИ в бизнесе, свяжитесь с нами по адресу hello@itinai.ru. Чтобы быть в курсе последних новостей в области ИИ, подписывайтесь на наш Telegram.

Посмотрите практический пример решения на базе ИИ: продажный бот, предназначенный для автоматизации взаимодействия с клиентами круглосуточно и управления взаимодействиями на всех этапах клиентского пути.

Новости в сфере искусственного интеллекта