“`html
Guided Reasoning: новый подход к улучшению многозадачной системы интеллекта
Грегор Бетц из Logikon AI, KIT представляет Guided Reasoning. Система с несколькими агентами является системой Guided Reasoning, если один из агентов, называемый руководителем, в основном работает с другими агентами для улучшения их рассуждений. Многозадачная система с руководящим агентом и по крайней мере одним клиентским агентом называется системой Guided Reasoning, если руководитель работает с клиентами планомерно и основным образом, чтобы заставить их рассуждать таким образом, который соответствует определенному методу M. Один из способов описать метод рассуждения M – это стандарты и критерии, ясные примеры или подробные правила и указания. Методы Guided Reasoning включают помощь тренера бизнес-юнита в проведении SWOT-анализа, помощь ребенка своей бабушке в решении кроссвордной задачи и сократовский диалог.
Значение Guided Reasoning в ИИ
На первый взгляд, преимущества Guided Reasoning в ИИ основаны на следующих предположениях:
- ИИ должен давать правильные ответы и объяснять их.
- ИИ-системы могут честно объяснять свои ответы только в том случае, если они основаны на четком мышлении.
- Плохие рассуждения затрудняют ИИ-системам давать правильные ответы.
- Сильные эксперты в области не всегда знают, как использовать продвинутые техники мышления.
Практическое применение метода Guided Reasoning
Стандартный способ использования Guided Reasoning в Logikon подразумевает, что при столкновении клиентских агентов с проблемой принятия решения, им говорят тщательно взвешивать все аргументы за и против.
- Шаг 1: Метод Guided Reasoning начинается при отправке пользователем запроса.
- Шаг 2: Клиент представляет утверждение проблемы руководителю, который организует шаги мышления для поиска ответа.
- Шаг 3: Руководитель может задавать клиенту вопросы.
- Шаг 4: Руководитель получает ответы клиента.
- Шаг 5: Ответы дополнительно обрабатываются и рассматриваются.
Руководитель устанавливает правила мыслительного процесса и управляет ходом работы, статически или динамически. Он переформулирует проблему после получения утверждения проблемы (на шаге 2). Шаги 3 и 4 позволяют клиенту отвечать на различные утверждения проблемы, не полагаясь друг на друга. Руководитель сравнивает возможные ответы, чтобы определить, понимает ли клиент проблему и что он должен сказать в ответ. Клиенту предоставляется четко написанное объяснение и краткое изложение процесса мышления (протокол). Если ИИ не разработал последовательные линии рассуждений и ответов на похожие формулировки проблем, клиент может ответить на первый вопрос пользователя.
После получения утверждения проблемы руководитель говорит клиенту думать о различных способах решения проблемы и перечислять все за и против каждого возможного решения. Руководитель использует следы мышления в качестве отправной точки для дальнейшего анализа. В частности, через ряд описанных ниже шагов он создает неформальную карту аргументов, которая делает ясными различные аргументы, выдвинутые во время мозгового штурма, и показывает, как они связаны с конкурирующими вариантами ответов прямо или косвенно.
Единственное утверждение показывает каждый случай на неформальной карте аргументов. Далее руководитель использует карту аргументов, чтобы заставить клиента оценить аргументы планомерно. Клиенту поручается оценить убедительность утверждения C, рассмотрев все аргументы за и против, которые были признаны разумными. Эта обратная, аргументированная проверка начинается с листовых узлов карты аргументов и заканчивается проверкой того, насколько правдоподобны основные утверждения.
При использовании метода Guided Reasoning Logikon создает прямые рассуждения, взвешивая за и против. Каждый шаг в программе Python Logikon соответствует различному классу аналитиков. Классы аналитиков в основном используют внутренние процессы LLM для создания необходимых логических артефактов.
IssueBuilder берет грубый след мыслительного процесса и, с помощью экспертов LLM, описывает основную проблему, о которой идет речь, обычно новым способом формулирования исходной проблемы.
ProsConsBuilder использует следы мыслительного процесса для составления списка за и против с несколькими корнями, которые решают уже выявленную основную проблему. Сам метод содержит несколько шагов: сначала из следа мыслительного процесса извлекаются все утверждения, относящиеся к проблеме, независимо от их валентности. Во втором шаге эти утверждения объединяются в один или несколько списков за и против. Это единственный шаг, на котором находятся и добавляются основные корневые утверждения. Последние списки за и против проверяются на наличие дубликатов и полноту (на основе начально данного утверждения) и, при необходимости, изменяются.
RelevanceNetworkBuilder использует набор шаблонов-подсказок для определения вероятности того, что какие-либо два утверждения являются взаимосвязанными друг с другом и любая пара утверждения и основное утверждение. Это создает полный граф всех утверждений и основных утверждений с взвешенными отношениями поддержки и атаки. (Любые два основных утверждения считаются максимально противоречивыми друг другу.)
FuzzyArgmapBuilder берет весь граф и, используя оптимальный метод разветвления, создает дерево, которое соединяет все узлы аргументов с наиболее сильными связями. Затем добавляет больше связей с весами выше определенного уровня. Этот процесс приводит к нечеткой карте аргументов, которая затем экспортируется в различные полезные форматы. Цель FuzzyArgmapBuilder состоит в предоставлении полного и наглядного представления процесса аргументации, что облегчает его понимание и анализ.
Проверьте статью и GitHub. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter и LinkedIn. Присоединяйтесь к нашему Telegram-каналу. Если вам нравится наша работа, вам понравится наш бюллетень.
Не забудьте присоединиться к нашему сообществу 50 тыс. пользователей в ML SubReddit.
Этот пост также доступен на английском языке на MarkTechPost.
“`