SimpleToM: Оценка способностей теории разума в больших языковых моделях

 SimpleToM: Evaluating Applied Theory of Mind Capabilities in Large Language Models

“`html

SimpleToM: Оценка возможностей Теории Ума в Больших Языковых Моделях

Теория Ума (ToM) – это способность понимать мысли и предсказывать поведение других людей. Эта способность становится все более важной с развитием Больших Языковых Моделей (LLMs), которые активно используются в человеческих взаимодействиях и принятии решений.

Проблемы существующих методов

Текущие методы оценки ToM в LLM имеют ряд ограничений:

  • Чрезмерная зависимость от классических тестов, таких как задача Салли-Анны.
  • Недостаток разнообразия в сценариях с асимметрией информации.
  • Слишком большая зависимость от явных слов, таких как “видит” и “думает”.
  • Неэффективная оценка неявного здравого смысла и практического применения ToM.

Введение в SimpleToM

Исследователи из Allen Institute for AI, Университета Вашингтона и Стэнфордского университета представили SimpleToM – новый набор данных для оценки возможностей ToM в LLM через короткие и разнообразные истории.

Как работает SimpleToM

SimpleToM использует трехуровневую структуру вопросов для тестирования различных аспектов ToM:

  • Осознание психического состояния: “Знает ли Мэри о плесени?”
  • Предсказание поведения: “Заплатит ли Мэри за чипсы или сообщит о плесени?”
  • Оценка поведения: “Мэри заплатила за чипсы. Это было разумно?”

Процесс создания и качество данных

SimpleToM включает строгий трехступенчатый процесс создания и контроля качества:

  • Создание начальных историй вручную.
  • Генерация вариантов историй с помощью LLM.
  • Тщательная проверка историй квалифицированными аннотаторами.

В результате было отобрано 1,147 высококачественных историй для тестирования возможностей ToM.

Анализ результатов

Анализ SimpleToM показывает, что современные модели, такие как GPT-4, демонстрируют высокую точность (>95%) в понимании психических состояний, но значительно хуже справляются с предсказанием поведения.

Практическое применение

SimpleToM представляет собой важный шаг вперед в оценке возможностей ToM в LLM. Это исследование подчеркивает необходимость более строгих тестов применяемой ToM для создания более социально компетентных ИИ-систем.

Как использовать ИИ в вашей компании

Если вы хотите развивать свою компанию с помощью ИИ, используйте SimpleToM для:

  • Анализа, как ИИ может изменить вашу работу.
  • Определения ключевых показателей эффективности (KPI) для улучшения.
  • Постепенного внедрения ИИ-решений, начиная с небольших проектов.

Если вам нужны советы по внедрению ИИ, пишите нам в Telegram. Следите за новостями о ИИ в нашем Telegram-канале или в Twitter.

Попробуйте AI Sales Bot – ИИ-ассистент в продажах, который помогает отвечать на вопросы клиентов и генерировать контент.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!

“`

Полезные ссылки: