Новый подход к стратегиям в играх: исследование AI представляет GRATR, методика доверительного рассуждения.

 Achieving Superior Game Strategies: This AI Paper Unveils GRATR, a Game-Changing Approach in Trustworthiness Reasoning

“`html

Разработка AI-решений для доверия в многопользовательских играх с неполной информацией

Разработка AI-решений для доверия в многопользовательских играх с неполной информацией представляет существенные вызовы. Игрокам необходимо оценивать надежность других на основе частичной, часто вводящей в заблуждение информации, принимая решения в реальном времени. Традиционные подходы, сильно зависящие от предварительно обученных моделей, испытывают трудности в адаптации к динамическим средам из-за зависимости от данных, специфичных для области, и обратной связи. Эти ограничения приводят к отсутствию возможности реального времени адаптации, что является важным для эффективного принятия решений в быстро меняющихся сценариях. Решение этих проблем критически важно для продвижения применения ИИ в сложных средах, особенно в контекстах, где оценка доверия в реальном времени критична, таких как в автономных системах и стратегических играх.

Текущие методы оценки доверия в таких средах включают символьное рассуждение, байесовское рассуждение и обучение с подкреплением (RL).

Символьное рассуждение фокусируется на согласованности и последовательности в моделях, но часто лишено гибкости в динамических средах. Байесовское рассуждение, хотя эффективно обновляет убеждения на основе доказательств, требует значительных вычислительных ресурсов и подвержено неточностям при работе с ограниченными или зашумленными данными. RL, хотя и мощное в принятии решений, требует огромного объема обучающих данных, что делает его непригодным для приложений в реальном времени. Эти методы, как правило, сталкиваются с вычислительной сложностью, ограниченной эффективностью данных и неспособностью эффективно работать в динамических средах реального времени.

Разработанный исследователями из Нанкинского университета информационных наук и технологий и Ханчжоуского университета дианзи фреймворк GRATR представляет собой новый подход, использующий Retrieval-Augmented Generation (RAG) для улучшения оценки доверия.

GRATR создает динамический граф доверия, который обновляется в реальном времени, интегрируя доказательственную информацию по мере ее поступления. Этот метод на основе графа решает ограничения статической обработки данных существующими моделями RAG, позволяя системе адаптироваться к развивающейся природе взаимодействий и доверительных отношений в реальном времени. GRATR улучшает рассуждение путем извлечения и интеграции наиболее релевантных доверительных данных из графа, улучшая принятие решений и уменьшая галлюцинации в больших языковых моделях (LLM). Этот подход представляет собой значительное развитие, предоставляя более точное и эффективное решение для оценки доверия в реальном времени.

Фреймворк GRATR инициализируется динамическим графом доказательств, где узлы представляют игроков, а ребра – доверительные отношения.

Граф непрерывно обновляется при получении новых наблюдений, с прикрепленными списками доказательств к ребрам и значениями доверительности к узлам. Ключевые компоненты включают фазу слияния доказательств, где доказательства агрегируются и оцениваются, и фазу прямого извлечения, где значения доверительности обновляются на основе извлеченных цепочек доказательств. GRATR был протестирован на многопользовательской игре “Оборотни” сравнительными экспериментами с базовыми LLM и LLM, улучшенными с помощью Native RAG и Rerank RAG. Набор данных для этих экспериментов состоял из 50 итераций игры с восьмью игроками, включая различные роли, такие как оборотни, жители и лидеры (ведьма, страж и предсказатель).

GRATR значительно превосходит базовые методы по показателям выигрыша и точности рассуждения.

Например, в одной группе экспериментов GRATR достиг общего показателя выигрыша 76,0%, по сравнению с 24,0% для базового LLM. Аналогично показатель выигрыша для роли оборотня составил 72,4% с GRATR по сравнению с 27,6% для базового метода. GRATR последовательно превзошел как Native RAG, так и Rerank RAG по различным метрикам, включая общий показатель выигрыша, показатель выигрыша оборотня и показатель выигрыша лидера. Например, в одном сравнении GRATR достиг общего показателя выигрыша 83,7%, а показатель выигрыша для роли оборотня составил 83,5%, что значительно превышает производительность LLM, улучшенного Rerank RAG.

GRATR представляет собой значительное развитие в оценке доверия для многопользовательских игр с неполной информацией.

Путем использования динамической структуры графа, обновляющейся в реальном времени, GRATR решает ограничения существующих методов, предлагая более точное и эффективное решение для принятия решений в реальном времени. Экспериментальные результаты подчеркивают превосходную производительность GRATR, особенно в улучшении рассуждения LLM, смягчая проблемы, такие как галлюцинации. Этот вклад готов оказать существенное влияние на исследования в области ИИ, особенно в областях, требующих надежной оценки доверия в реальном времени, таких как автономные системы и стратегические игровые среды.

Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на нас в Twitter и присоединиться к нашему Telegram-каналу и группе LinkedIn. Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему сообществу в Reddit с более чем 50 тыс. участников.

Вот рекомендуемый вебинар от нашего спонсора: “Разблокируйте потенциал ваших данных Snowflake с помощью LLM”.

Источник: MarkTechPost

“`

Полезные ссылки: