“`html
Продвижение языковых моделей от обдуманного рассуждения к интуитивным ответам через самостоятельное обучение
Когнитивная психология стремится понять, как люди обрабатывают, хранят и вспоминают информацию, и теория двойных систем Канемана предоставляет важную основу. Эта теория различает между Системой 1, которая работает интуитивно и быстро, и Системой 2, которая включает обдуманные и сложные рассуждения. Языковые модели (ЯМ), особенно те, которые используют трансформерные архитектуры, такие как GPT-4, сделали значительный прогресс в искусственном интеллекте. Однако основной вызов заключается в определении, могут ли ЯМ последовательно генерировать эффективные и точные результаты без явного подталкивания к цепочке рассуждений (CoT). Это указало бы на развитие интуитивного процесса, аналогичного мышлению Системы 1 у человека.
Практические решения и ценность
Несколько попыток были предприняты для улучшения способностей ЯМ к рассуждению. Поддержка CoT стала популярным методом, который помогает моделям разбивать сложные проблемы на более мелкие шаги. Однако этот подход требует явного подталкивания и может быть ресурсоемким. Другие подходы сосредоточились на настройке моделей с дополнительными данными обучения или специализированными наборами данных, но эти методы не полностью преодолевают вызов развития интуитивных рассуждений. Цель остается в создании моделей, способных генерировать быстрые и точные ответы без полагания на обширное подталкивание или дополнительные данные обучения.
Исследователи из Шанхайского университета инженерных наук, INF Technology (Шанхай) Co., Ltd., Монашского университета в Мельбурне, Австралия, и Шанхайского университета Фудань предложили CogniDual Framework for LLMs (CFLLMs). Этот инновационный подход исследует, могут ли языковые модели эволюционировать от обдуманных рассуждений к интуитивным ответам через самостоятельное обучение, отражая развитие когнитивных способностей человека. CFLLMs выделяют когнитивные механизмы, лежащие в основе генерации ответов ЯМ, и предоставляют практические преимущества путем снижения вычислительных затрат во время вывода. Более того, исследователи доказали существенные различия в точности ответов между подходами с CoT и без него.
Предложенный метод разработан для исследования пяти ключевых вопросов о когнитивных и рассуждательных способностях языковых моделей, таких как Llama2. Эксперименты проводятся для определения, обладают ли эти модели характеристиками, аналогичными двойной когнитивной системе человека, и может ли самостоятельная практика без руководства CoT улучшить их рассуждательные способности. Более того, эксперимент исследует, обобщаются ли улучшенные рассуждательные способности на различные задачи рассуждения. Этот детальный подход обеспечивает глубокую оценку того, насколько хорошо ЯМ могут развивать интуитивные рассуждения, аналогичные когнитивным способностям человека.
CFLLMs продемонстрировали существенное улучшение производительности без подталкивания CoT, особенно на задачах, включающих логический вывод на естественном языке. Например, на наборе данных LogiQA2.0, более маленькие модели, такие как Llama2-7B и Vicuna-7B, продемонстрировали улучшения в точности без CoT после применения этой структуры. Это указывает на потенциал превращения способностей Системы 2 в интуитивные ответы, аналогичные Системе 1, через практику. Однако структура показала минимальное улучшение на наборе данных GSM8K из-за заражения задачей во время обучения. В целом, более крупные модели требовали меньше примеров для достижения своей емкости Системы 1, показывая их большую способность использовать ограниченные данные для улучшения.
В заключение, исследователи представили CogniDual Framework for LLMs (CFLLMs), инновационный подход для определения, могут ли языковые модели эволюционировать от медленного рассуждения к интуитивным ответам. Экспериментальные результаты демонстрируют, что ЯМ могут сохранять улучшенные способности в решении проблем после самостоятельного обучения без явных подталкиваний CoT. Это подтверждает гипотезу о том, что ЯМ могут превратить рассуждения Системы 2 в более интуитивные ответы, аналогичные Системе 1, с помощью соответствующего обучения. Будущие усилия должны решить текущие ограничения и исследовать, как CFLLMs влияют на когнитивные предпочтения обработки ЯМ, с целью развития более эффективных и интуитивных систем искусственного интеллекта.
Проверьте статью. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter и присоединиться к нашей группе в LinkedIn. Если вам нравится наша работа, вам понравится наш новостной бюллетень.
Не забудьте присоединиться к нашему сообществу Reddit.
БЕСПЛАТНЫЙ ВЕБИНАР ПО ИСКУССТВЕННОМУ ИНТЕЛЛЕКТУ: “SAM 2 для видео: как настроить на ваши данные” (Ср, 25 сентября, 4:00 – 4:45 EST)
Статья CogniDual Framework for LLMs: Advancing Language Models from Deliberate Reasoning to Intuitive Responses Through Self-Training была опубликована на MarkTechPost.
Как использовать искусственный интеллект для развития вашего бизнеса
Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте CogniDual Framework for LLMs: Advancing Language Models from Deliberate Reasoning to Intuitive Responses Through Self-Training.
Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI.
Определитесь какие ключевые показатели эффективности (KPI): вы хотите улучшить с помощью ИИ.
Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI.
На полученных данных и опыте расширяйте автоматизацию.
Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.
Попробуйте AI Sales Bot. Этот AI ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж, снижать нагрузку на первую линию.
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!
“`